Checkpoint multi-page readability work
Restructured code to better support multi-page readability. Improved tests. Conflicts: src/readability_lxml/readability.py src/tests/regression.py0.3.0.dev
parent
5cb4b8b8c0
commit
f02fe79840
@ -0,0 +1,60 @@
|
|||||||
|
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
|
||||||
|
<html>
|
||||||
|
<head>
|
||||||
|
<title>A Simple Multi-Page Article For Testing : Page 3</title>
|
||||||
|
</head>
|
||||||
|
<body>
|
||||||
|
<h1>A Simple Multi-Page Article For Testing : Page 3</h1>
|
||||||
|
<p>
|
||||||
|
Nullam laoreet, nibh non faucibus dictum, tellus libero varius
|
||||||
|
erat, lobortis varius est massa quis metus. Donec vitae justo
|
||||||
|
lacus, nec convallis metus. Suspendisse potenti. Nunc et rutrum
|
||||||
|
justo. Maecenas ultrices ipsum in magna fermentum eleifend. Fusce
|
||||||
|
sagittis pretium aliquam. Vestibulum et gravida lorem. Sed turpis
|
||||||
|
quam, placerat ac ultrices eu, tempor sit amet elit. Curabitur eu
|
||||||
|
imperdiet velit. Quisque pharetra ornare nunc, a volutpat metus
|
||||||
|
aliquam quis. Vivamus semper aliquam cursus. Nullam ac nibh nulla,
|
||||||
|
luctus pharetra nunc. Etiam ut sapien sem. Fusce vehicula, sem sit
|
||||||
|
amet viverra pretium, magna tortor suscipit nisi, id interdum lorem
|
||||||
|
orci in tellus. Vivamus vel ipsum eros. Fusce porttitor convallis
|
||||||
|
ultricies. Etiam in risus diam, viverra suscipit felis. Duis vitae
|
||||||
|
imperdiet est.
|
||||||
|
</p>
|
||||||
|
<p>
|
||||||
|
Nunc nunc magna, facilisis blandit venenatis ut, scelerisque ac
|
||||||
|
tortor. Cras condimentum fermentum lectus ac convallis. Suspendisse
|
||||||
|
cursus, lacus sit amet sodales molestie, dui erat varius velit, non
|
||||||
|
tincidunt metus dui sed nulla. Aliquam lacus orci, convallis ut
|
||||||
|
pellentesque ac, molestie et dolor. Ut pretium enim ut nunc auctor
|
||||||
|
eget placerat magna luctus. Duis mollis ligula a orci ultrices in
|
||||||
|
facilisis felis feugiat. Morbi eget odio eget erat pulvinar
|
||||||
|
placerat sed nec erat. Duis dignissim, dolor a lacinia commodo,
|
||||||
|
metus erat laoreet dui, in lacinia felis lacus vitae nulla. Fusce
|
||||||
|
imperdiet condimentum volutpat. Vivamus ut lacus a eros cursus
|
||||||
|
scelerisque non sit amet orci. Phasellus id quam odio. Nulla
|
||||||
|
adipiscing venenatis lorem nec feugiat. Aenean sit amet nisl odio,
|
||||||
|
tincidunt scelerisque nisl. Curabitur ut nisl a dui facilisis
|
||||||
|
vulputate. Mauris eu elit et felis hendrerit blandit. Cras magna
|
||||||
|
dolor, imperdiet eget rutrum tempus, euismod nec augue.
|
||||||
|
</p>
|
||||||
|
<p>
|
||||||
|
Ut in sem sit amet felis scelerisque elementum. Suspendisse vitae
|
||||||
|
neque magna, in laoreet felis. Aenean elit ligula, tempor in
|
||||||
|
vestibulum ac, porttitor nec lacus. Aenean urna mi, dictum feugiat
|
||||||
|
placerat eget, congue nec dolor. Etiam pellentesque dictum nulla id
|
||||||
|
vulputate. Etiam sit amet vehicula purus. Integer quis mi nisl,
|
||||||
|
gravida malesuada enim. Donec malesuada felis nisi. Etiam id magna
|
||||||
|
a libero pulvinar ullamcorper in nec neque. Duis pulvinar massa nec
|
||||||
|
magna scelerisque vitae vulputate ipsum luctus.
|
||||||
|
</p>
|
||||||
|
<ul id="pageNumbers">
|
||||||
|
<li> 1 </li>
|
||||||
|
<li>
|
||||||
|
<a title="Page 1" href="/article.html">1</a>
|
||||||
|
</li>
|
||||||
|
<li>
|
||||||
|
<a title="Page 2" href="/article.html?pagewanted=2">2</a>
|
||||||
|
</li>
|
||||||
|
</ul>
|
||||||
|
</body>
|
||||||
|
</html>
|
Loading…
Reference in New Issue