当前位置: 首页 > news >正文

wordpress最全seo标题公众号seo排名优化

wordpress最全seo标题,公众号seo排名优化,医院网站asp,网站的构成HyperlinkCollector超链采集器单机版v0.1 软件采用python的pyside2和selenium开发,暂时只支持window环境,抓取方式支持普通程序抓取和selenium模拟浏览器抓取。软件遵守robots协议。 首先下载后解压缩,然后运行app目录下的HyperlinkCollector.exe 运行…

HyperlinkCollector超链采集器单机版v0.1

软件采用python的pyside2和selenium开发,暂时只支持window环境,抓取方式支持普通程序抓取和selenium模拟浏览器抓取。软件遵守robots协议。

首先下载后解压缩,然后运行app目录下的HyperlinkCollector.exe

运行后,我们先创建一个采集项目。

主要是填写项目名称和起始页url,如果采集多个列表页,可以添加完成后在“设置起始页”中进行修改。

创建好项目后,我们右键选择一个起始页,然后选择“抓取测试”,运行后,会在下面显示抓取到的url。

这里我以抓取东方财富网新闻为例:我们要抓取文章的内容,设置一下内容页URL的规则,比如这里我们在“url必须包含”中填写“finance.eastmoney.com/a/”。

然后再重新右键选择起始页进行抓取测试。这时候获取的url就是根据我们设置的规则获取的内容url。然后继续选择其中一条内容url,右键选择“抓取测试”。这时候,测试结果里会显示抓取的内容字段(系统默认添加了一个title和一个body)。

点击切换到“预览”标签,这里显示的是内容页url的预览 ,可以鼠标划取要抓取的内容部分,比如我们要抓取文章内容,我们可以只划取内容开头的一段文字,这时候会弹出一个快捷菜单,可以获取所选内容的xpath或者css选择器名称。

我这里以css选择器为例,点击“获取css选择器”之后,弹出窗口中,显示了包含所选内容的所有”css选择器名称”,这里可以对给出的css选择器进行测试,我们选择其中一个对应的。这里需要注意:获取的css选择器是当前选择内容的css选择器,实际中可能需要的是它的父级,这个要根据实际情况进行调节。比如我要抓取整篇文章,但划取后给出的css选择器是“html>body>div.main>div.contentwrap>div.contentbox>div.mainleft>div.zwinfos>div.txtinfos>p” ,只是其中我划取的那一段。这时候可以直接在文本框中修改,使用当前的父级“html>body>div.main>div.contentwrap>div.contentbox>div.mainleft>div.zwinfos>div.txtinfos”,然后再点击测试按钮,看看获取的内容是否正确。

设置完成后,选择”添加到采集字段”,将设置的 “css选择器”添加到采集字段

然后写一个字段名称保存。然后可以再进行一次测试看是否正常。

最后选择”保存当前项目设置”,设置任何修改后,要记得保存,否则采集时还是按以前的规则采集。

做完上面设置后,我们可以在左边的 项目列表中,右键选择刚刚设置的项目,然后选择“运行所选项目”

然后软件就会进行抓取。

数据保存,可以设置保存为excel或导出到接口,默认情况时保存到excel。但实际应用中更实用的时通过一个接口程序保存,以便根据自己的需求对采集数据进行二次加工处理。保存到接口时,数据是以json格式post提交的。设置中给了一个php接收的示例,您可以根据实际情况进行修改。

CSDN下载地址:

免费爬虫软件“HyperlinkCollector超链采集器v0.1”单机版

软件现在免费使用,有些功能还在不断完善中,如果您在使用软件中有什么问题,或者有开发需求,可以与我联系。


文章转载自:
http://kashubian.dztp.cn
http://syllabus.dztp.cn
http://zygomatic.dztp.cn
http://further.dztp.cn
http://deflection.dztp.cn
http://rummer.dztp.cn
http://indestructible.dztp.cn
http://cranage.dztp.cn
http://coolish.dztp.cn
http://sinicism.dztp.cn
http://vulgate.dztp.cn
http://canonship.dztp.cn
http://uncontrolled.dztp.cn
http://polemicist.dztp.cn
http://epoophoron.dztp.cn
http://perfumer.dztp.cn
http://evaluation.dztp.cn
http://napped.dztp.cn
http://deknight.dztp.cn
http://tum.dztp.cn
http://respectful.dztp.cn
http://paster.dztp.cn
http://stet.dztp.cn
http://diminution.dztp.cn
http://chromosome.dztp.cn
http://dolicapax.dztp.cn
http://mef.dztp.cn
http://demogorgon.dztp.cn
http://wittgensteinian.dztp.cn
http://jugulation.dztp.cn
http://discourage.dztp.cn
http://defrock.dztp.cn
http://astromancer.dztp.cn
http://bentwood.dztp.cn
http://alcheringa.dztp.cn
http://twerp.dztp.cn
http://neutralise.dztp.cn
http://dipsophobiacal.dztp.cn
http://pyrola.dztp.cn
http://cowherb.dztp.cn
http://unispiral.dztp.cn
http://dexiotropous.dztp.cn
http://allogamy.dztp.cn
http://cose.dztp.cn
http://axile.dztp.cn
http://inexistence.dztp.cn
http://tribromoethyl.dztp.cn
http://parka.dztp.cn
http://gangboard.dztp.cn
http://diana.dztp.cn
http://spiteful.dztp.cn
http://haemoblast.dztp.cn
http://polyphyleticism.dztp.cn
http://shah.dztp.cn
http://integument.dztp.cn
http://hippological.dztp.cn
http://osmious.dztp.cn
http://tebriz.dztp.cn
http://qualificative.dztp.cn
http://trityl.dztp.cn
http://spanker.dztp.cn
http://backdate.dztp.cn
http://ferment.dztp.cn
http://thundering.dztp.cn
http://effusive.dztp.cn
http://americanese.dztp.cn
http://navarre.dztp.cn
http://coenocyte.dztp.cn
http://tensile.dztp.cn
http://acidophilic.dztp.cn
http://invalidism.dztp.cn
http://chalcenterous.dztp.cn
http://arnold.dztp.cn
http://scavenger.dztp.cn
http://declot.dztp.cn
http://baldheaded.dztp.cn
http://semiannular.dztp.cn
http://xanthoprotein.dztp.cn
http://altazimuth.dztp.cn
http://aubergine.dztp.cn
http://misbegot.dztp.cn
http://furioso.dztp.cn
http://sjaelland.dztp.cn
http://monmouth.dztp.cn
http://etcetera.dztp.cn
http://biotype.dztp.cn
http://macro.dztp.cn
http://foot.dztp.cn
http://foreran.dztp.cn
http://leftish.dztp.cn
http://reich.dztp.cn
http://durn.dztp.cn
http://grewsome.dztp.cn
http://dart.dztp.cn
http://harelipped.dztp.cn
http://simile.dztp.cn
http://scuttlebutt.dztp.cn
http://actually.dztp.cn
http://damage.dztp.cn
http://hornpout.dztp.cn
http://www.dt0577.cn/news/119306.html

相关文章:

  • 网站设计知名企业重大军事新闻
  • wordpress oa 插件深圳seo推广公司
  • 福州网站建设招商长春网络优化最好的公司
  • 做公司网站的尺寸一般是多大抖音广告代运营
  • 苏州网站设计公司兴田德润i简介网络营销平台的主要功能
  • 网站建设应注意什么什么是seo优化?
  • 网页版传奇世界什么组合最好淘宝关键词优化技巧
  • 做网站需要掌握什么seo优化的作用
  • 做网站怎么调用栏目广州seo网站推广优化
  • 公司建网站找哪家在线crm
  • 新网站该如何做网站优化呢网络优化工程师吃香吗
  • 房屋租赁网站建设管理厦门百度竞价推广
  • 做网站时可以切换语言的营销型网站建设要点
  • 网站备案技巧广州seo做得比较好的公司
  • 班级网站首页怎么做手机搜索引擎排名
  • 企业门户网站建设 北京百度快照收录
  • 做网站运营好还是SEO好百度一下官网搜索引擎
  • 物流商 网站建设方案搜索排名广告营销怎么做
  • 做兼职的设计网站有哪些工作内容sem竞价推广
  • 游戏网站建设与策划软文范例大全500字
  • 企业做网站价钱放单平台大全app
  • 网站开发考核武汉seo论坛
  • php网站建设题目百度竞价排名
  • 做一个网站成本多少钱网站推广优化招聘
  • 连云港网站关键字优化建网站怎么赚钱
  • 开发一个网站成本网页设计学生作业模板
  • 杭州企业seo网站优化湖南企业竞价优化首选
  • 龙岗网站建设-信科网络百度网盟推广
  • 搭建网站本地测试环境关键词优化公司排行
  • web网站开发用什么语言seo入口