本篇文章主要介绍了node.js 利用cheerio制作简单的网页爬虫示例,现在分享给大家,也给大家做个参考。
本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例,分享给大家,具有如下:
1. 目标
完成对网站的标题信息获取
将获取到的信息输出在一个新文件
工具: cheerio,使用npm下载npm install cheerio
cheerio的API使用方法和jQuery的使用方法基本一致
如果熟练使用jQuery,那么cheerio将会很快上手
2. 代码部分
介绍: 获取segment fault页面的列表标题,将获取到的标题列表编号,最终输出到pageTitle.txt文件里
const https = require('https');const fs = require('fs');const cheerio = require('cheerio');const url = 'https://segmentfault.com/';https.get(url, (res) => { let html = ''; res.on('data', (data) => { html += data; }); res.on('end', () => { getPageTitle(html); });}).on('error', () => { console.log('获取网页信息错误');});function getPageTitle(html) { const $ = cheerio.load(html); let chapters = $('.news__item-title'); let data = []; let index = 0; let fileName = 'pageTitle.txt'; for (let i = 0; i { if (err) { console.log('fs文件系统创建新文件失败', err); } console.log(`已成功将获取到的标题放入新文件${fileName}文件中`) })}
登录后复制
上面是我整理给大家的,希望今后会对大家有帮助。
相关文章:
聊聊JS动画库 Velocity.js的使用
vue toggle做一个点击切换class(实例讲解)
Vue2.0 给Tab标签页和页面切换过渡添加样式的方法
以上就是在Node.js中使用cheerio制作简单的网页爬虫(详细教程)的详细内容,更多请关注【创想鸟】其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2750657.html