在Node.js中使用cheerio制作简单的网页爬虫（详细教程）

PHP中文网 • 2025年3月8日 05:40:07 • 编程技术 • 阅读 2

本篇文章主要介绍了node.js 利用cheerio制作简单的网页爬虫示例，现在分享给大家，也给大家做个参考。

本文介绍了Node.js 利用cheerio制作简单的网页爬虫示例，分享给大家，具有如下：

1. 目标

完成对网站的标题信息获取

将获取到的信息输出在一个新文件

工具: cheerio，使用npm下载npm install cheerio

cheerio的API使用方法和jQuery的使用方法基本一致

如果熟练使用jQuery，那么cheerio将会很快上手

2. 代码部分

介绍: 获取segment fault页面的列表标题，将获取到的标题列表编号，最终输出到pageTitle.txt文件里

const https = require('https');const fs = require('fs');const cheerio = require('cheerio');const url = 'https://segmentfault.com/';https.get(url, (res) => {  let html = '';  res.on('data', (data) => {    html += data;  });  res.on('end', () => {    getPageTitle(html);  });}).on('error', () => {  console.log('获取网页信息错误');});function getPageTitle(html) {  const $ = cheerio.load(html);  let chapters = $('.news__item-title');  let data = [];  let index = 0;  let fileName = 'pageTitle.txt';  for (let i = 0; i  {    if (err) {      console.log('fs文件系统创建新文件失败', err);    }    console.log(`已成功将获取到的标题放入新文件${fileName}文件中`)  })}

登录后复制

上面是我整理给大家的，希望今后会对大家有帮助。

聊聊JS动画库 Velocity.js的使用

vue toggle做一个点击切换class(实例讲解)

Vue2.0 给Tab标签页和页面切换过渡添加样式的方法

以上就是在Node.js中使用cheerio制作简单的网页爬虫（详细教程）的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2750657.html

cheerio:javascript node.js

0 0

关于作者

PHP中文网签约作者

432.0K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

如何使用AngularJs用户输入动态模板XSS攻击

上一篇 2025年3月8日 05:40:04

如何使用vue源码解析事件机制

下一篇 2025年3月8日 05:40:13

如何使用AngularJs用户输入动态模板XSS攻击

这次给大家带来如何使用AngularJs用户输入动态模板XSS攻击，使用AngularJs用户输入动态模板XSS攻击的注意事项有哪些，下面就是实战案例，一起来看一下。概述 XSS攻击是Web攻击中最常见的攻击方法之一，它是通过对网页注入可…

PHP中文网
编程技术 2025年3月8日
2000
编程技术

怎样使用js实现字符串去重及数组去重

这次给大家带来怎样使用js实现字符串去重及数组去重，使用js实现字符串去重及数组去重的注意事项有哪些，下面就是实战案例，一起来看一下。 js数组、字符串去重 /*数组去重*/ function quchong(arr){ var len =…

PHP中文网
2025年3月8日
2000
怎样使用js Element Traversal规范元素遍历

这次给大家带来怎样使用js Element Traversal规范元素遍历，使用js Element Traversal规范元素遍历的注意事项有哪些，下面就是实战案例，一起来看一下。对于元素间的空格，在IE9之前，都不会返回文档节点，其它…

PHP中文网
编程技术 2025年3月8日
2000
使用Node.js如何实现静态服务器

这篇文章主要介绍了node.js静态服务器的实现方法，非常不错，具有参考借鉴价值,需要的朋友可以参考下当你输入一个url时，这个url可能对应服务器上的一个资源（文件）也可能对应一个目录。 So服务器会对这个url进行分析，针对不同的情况…

PHP中文网
编程技术 2025年3月8日
2000
利用JS脚本加载后如何实现能执行相应回调函数

本文主要讲解怎么在成功加载 js 文件后再执行相应回调任务,对js脚本加载后执行相应回调函数的操作方法感兴趣的朋友，通过本文学习下吧项目中经常会遇到这样的问题：当某个 js 脚本加载完成后再执行相应任务，但很多朋友可能并不知道怎么判断我们…

PHP中文网
编程技术 2025年3月8日
2000
怎样使用JS+setInterval实现计时器

这次给大家带来怎样使用JS+setInterval实现计时器，使用JS+setInterval实现计时器的注意事项有哪些，下面就是实战案例，一起来看一下。使用setInterval实现计时，并且满60秒向分钟进一，满60分钟向小时进一。 …

PHP中文网
编程技术 2025年3月8日
2000
编程技术

如何使用JS倒计时恢复按钮点击功能

这次给大家带来如何使用JS倒计时恢复按钮点击功能，使用JS倒计时恢复按钮点击功能的注意事项有哪些，下面就是实战案例，一起来看一下。倒计时时间到后，恢复按钮点击，常用于阅读协议：阅读协议倒计时 var tim=9; function aa…

PHP中文网
2025年3月8日
2000
编程技术

如何操作JS实现html中placeholder属性提示文字

这次给大家带来如何操作JS实现html中placeholder属性提示文字，操作JS实现html中placeholder属性提示文字的注意事项有哪些，下面就是实战案例，一起来看一下。如何通过js实现html的placeholder属性效果…

PHP中文网
2025年3月8日
2000
在Node.js中如何使用DNS模块（详细教程）

本篇文章给大家详细介绍了node.js中dns模块的相关知识点，以及相关的实例代码做了分享，有兴趣的朋友参考下。 1. DNS 在Node.js中，提供DNS模块，以实现域名查找及域名解析的处理。在DNS模块中，提供了三个主方法及一系列便…

PHP中文网
编程技术 2025年3月8日
2000
在angularjs中使用select 赋值 ng-options配置方法该怎么做？

下面我就为大家分享一篇angularjs select 赋值 ng-options配置方法，具有很好的参考价值，希望对大家有所帮助。数组方式数据是数组 $scope.years = [2014, 2015, 2016];登录后复制页面…

PHP中文网
编程技术 2025年3月8日
2000

发表回复

登录后才能评论

在Node.js中使用cheerio制作简单的网页爬虫（详细教程）

关于作者

AD推荐 黄金广告位招租... 更多推荐

相关推荐

发表回复

分享到:

请登录

AD推荐黄金广告位招租... 更多推荐