遇到难题了 ,谁能帮我解决 ,很棘手。 抓取超链接的问题

http://v.ku6.com/film/show_128630/tVIQRmpgDcd9xayf.html
比如说上面的这个酷6的链接,我要取出其中的电视剧所有集数的超链接,用正则表达式可以获取。可是问题来了, 打开这个网址的朋友应该能看到级数那里有省略号, 所有我无法从他的html代码中获取 省略号那部分的集数超链接。请问谁能解决这个问题

<li ><a href="http://v.ku6.com/...h.html" title="" >10</a></li>
<li ><a href="http://v.ku6.com/...zPxJ.html" title="" >11</a></li>
<li class="w">……</li>
<li ><a href="http://v.ku6.com/...zBv5.html" title="null" >34</a></li>
<li ><a href="http://v.ku6.com/...lByrC.html" title="null" >35</a></li>
<li ><a href="http://v.ku6.com/...H4cBu.html" title="null" >36</a></li>

这是html片段,
用正则取出1-11, 然后打开11的链接, 继续取11-n, 如此几次, 便能取完, 不可能一次性取出.
温馨提示:答案为网友推荐,仅供参考
第1个回答  2011-08-12
这是程序判断的逻辑有问题,因为本页只有这么多的链接

首先抓取本页的链接,知道需要抓36个链接。

如果发现指定的区域有...,需要再打开上一个链接(就是第11集),再根据新的页面取后面的链接(包括了3个不重复的链接),取最后一个...的上一个链接,再继续抓,如此往复,直到所有的36个不重复的链接都已经抓取