百度搜索中url的参数解析

小伙伴们在写爬虫程序的时候,可能会用到部分参数使用,这里整理了 百度搜索中url的参数解析,免费查询快递物流

wd–查询的关键词,

pn–已显示的结果条数,即当前页从pn条记录开始显示,该值为10的倍数。

cl–搜索类型,cl=3为网页搜索 cl=2为图片搜索或新闻搜索,cl=0是所有结果,其他值未知。当搜索结果中出现“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”,点击之后的cl的值为0,而此时显示的结果相对比较多。

rn–搜索结果中每页显示的条数,取值范围在10、20、50、100,缺省设置rn=10

ie–查询输入文字的编码,缺省设置ie=gb2312,即为简体中文。

tn– 提交搜索请求的来源站点。一个有用的tn:tn=baidulocal 表示百度站内搜索,返回的结果是很干净的,没有任何广告。另外,从做百度联盟搜索的网站A 搜索过来的都有这个tn参数,当你点击搜索结果中带“推广”的网站B,做百度“推广”的网站B的户主账户中就会被扣掉一部分费用,其中一部分百度留着,另外一小部分给网站A的户主,因为你从网站A搜索过来的。

lm–限定要搜索的网页的时间,值为0、1、7、30、360,以天为单位,例如搜索最近一个月的网页,lm=30。默认值为0,表示没有时间限制。

ct–语言,0-所有语言,1-简体中文网页,2-繁体中文网页;默认值为0。

bs–上一次搜索的关键词,应该与相关搜索有关。

ft–搜索的文档格式,pdf、doc、xls、ppt、rtf等,默认值为空。

q1–包含以下的全部的关键词

q2–包含以下的完整关键词

q3–包含以下任意一个关键词

q4–不包括以下关键词

q5–关键词位置,为空表示网页的任何地方,1表示仅网页标题中,2表示仅网页URL网址中。

q6–限定在某个指定的网站,比如q6=http://www.baidu.com/,表示仅在http://www.baidu.com/中搜索

原文链接:https://www.zhihu.com/question/20642243/answer/56522791

0 评论
内联反馈
查看所有评论