请在Chrome、Firefox等现代浏览器浏览本站。网站域名:森林之家(www.foresthouse.cn)爱学习、爱分享、爱绿软、爱恐怖、爱音乐、爱唠叨、爱折腾、爱生活!

火车头模块到底怎么做?

心得笔记 forest 488℃ 已收录 0评论

这里以DEDE自定义模型和火车头7.6为例,因为网上大多都是文章类的就不说了。前期我增加了一个产品中心的内容模型,并且加了一个video的字段用来做视频介绍。现在想采集大量内容到这个模型中去,这里采集规则就不写了只写发布模块。


首先打开Web发布配置管理来新建一个模块,先在内容发布参数中用Fiddler进行抓包,在我们刚建立的产品中心模型处发文章(注意,把该填的都填了先不用发)如下图:


然后打开Fiddler工具抓包,如果有太多内容先按Ctrl+X清空流,然后再点击网站中的确定把内容发出去。如下图:


双击A处,点击B处,再点击C处查看抓包数据;1为发表地址后缀、2为来源页面后缀、3是POST数据包。

接着回到刚才建立的发布模块点击“内容发布参数”,在发表地址后缀、来源页面后缀分别复制上面的1和2。还有一个POST包我们在Fiddler中复制“——WebKitFormBoundaryf1uWwVU3rOloBfAQ”一直到结尾全部复制,这串开头的字符串可能不一样但是长得很像很好认,点击“粘贴抓包获取的数据”把它复制进去程序会自动分析并处理。如下图:


现在我们已经抓到发布的数据,这里的内容根据火车头的标签套一下就好了,比如表单值是“这是标题”,就把在采集时自己加的标题这个标签填写进来,这些参数是什么意思呢?

“channelid”这是模型ID,一般普通文章是1、图片集是2、软件是3、商品是4。“title”,“shorttitle”,“tags”,“picname”,“typeid”,“videobody”标题、短标题、TAG、缩略图、栏目ID、内容,还有一些时间啊作者啊啥的一看就明白都是字面意思,把它们的相应的和标签套一下就行了。这里要注意一点,typeid、channelid、videobody和video。到此发布就做了了,还有一个获取分类的功能也要实现点击“获取栏目列表”把下面三个代码分别粘贴到“刷新列表页”、“来源页面后缀”、“和分类列表名称及ID格式”处。

/catalog_do.php?dopost=GetSunLists&locoypost=vus520
/catalog_main.php
<a href='catalog_do.php?cid=[分类ID]&dopost=listArchives'>[分类名称]</a>

为了保险起见点击“网页随机值获取”分别把以下三行代码粘贴到对应的位置,注意第三个代码要和图片一样。

/article_add.php
/article_add.php?channelid=200&cid=0
<input name="pubdate" value=""
最后一个网站自动登陆,不登陆肯定不能发了,这里点击“自动抓取登录数据包”后在小窗口中正常登陆网站,登陆成功后会有一串cookie、用户名和密码直接点确定就好了。小技巧:在模块出问题又很迷惘的时候可以借助Fiddler查看错误信息它会把网页的源代码显示出来自己看看是哪里出了问题。
本站文章如未注明,均为原创丨本网站采用BY-NC-SA协议进行授权,转载请注明转自:https://www.foresthouse.cn/archives/6212.html
喜欢 (0)or分享 (0)
发表我的评论(注:在您评论完以后不会立即显示,请不要重复刷新以免进入黑名单。)
取消评论
表情 代码 贴图 加粗 链接 私信 删除线 签到

Hi,请填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址