在Node.js中使用cheerio制作简单的网页爬虫(详细教程)

本篇文章主要介绍了node.js 利用cheerio制作简单的网页爬虫示例,现在分享给大家,也给大家做个参考。

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例,分享给大家,具有如下:

1. 目标

完成对网站的标题信息获取

将获取到的信息输出在一个新文件

工具: cheerio,使用npm下载npm install cheerio

cheerio的API使用方法和jQuery的使用方法基本一致

如果熟练使用jQuery,那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题,将获取到的标题列表编号,最终输出到pageTitle.txt文件里

const https = require('https');const fs = require('fs');const cheerio = require('cheerio');const url = 'https://segmentfault.com/';https.get(url, (res) => {  let html = '';  res.on('data', (data) => {    html += data;  });  res.on('end', () => {    getPageTitle(html);  });}).on('error', () => {  console.log('获取网页信息错误');});function getPageTitle(html) {  const $ = cheerio.load(html);  let chapters = $('.news__item-title');  let data = [];  let index = 0;  let fileName = 'pageTitle.txt';  for (let i = 0; i  {    if (err) {      console.log('fs文件系统创建新文件失败', err);    }    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)  })}

登录后复制

上面是我整理给大家的,希望今后会对大家有帮助。

相关文章:

聊聊JS动画库 Velocity.js的使用

vue toggle做一个点击切换class(实例讲解)

Vue2.0 给Tab标签页和页面切换过渡添加样式的方法

以上就是在Node.js中使用cheerio制作简单的网页爬虫(详细教程)的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2750657.html

(0)
上一篇 2025年3月8日 05:40:04
下一篇 2025年3月8日 05:40:13

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

登录后才能评论