目标:获取某官方微博所发布的所有微博。

遇到的困难:登录。下一页。

我在网上看了很多案例,我能通过借鉴,抓取不需要登录的网页的源码获取(基础的就只有几行那种),但是对于登录和cookie,不是很明白,比如,登录是传递参数到服务器,但是我还是uername还是name来传?这些是怎么定的?还有cookie,简直不能明白。

我大致的思路是,先到微博登陆页面模拟登录,并获取cookie。然后带着cookie输入该官方微博的网页获取网页源码。这样思考对么?

下一页的问题,该如何看呢?

有知道的伙伴可以讲讲思路么?

2 收藏


直接登录
最新评论