广告国内BGP机房32G内存299元网站收录排名问题解决【超牛】搜外友链平台站长在线扒站工具【免费】【免费】站长开发工具箱【推荐】站长自动外链工具广告位联系QQ：253000106 独立服务器100M/不限/免备 2核2G服务器新用户低至68元/年虚拟资源平台,轻松变现 10000来路IP只需8元站群系统程序-专注SEO站群黑帽SEO论坛_黑帽聚集地企业HTTP代理IP服务提供商软文推广，在线获客【定制】站群服务器99元起 SEO免费工具分享外推代发包收录【国内国际】短信推广，免费测试实力产品收量外链代发 5分一条快速排名 █一解决“收录、排名”问题一█ ●●●优质搜狗泛收录域名●●● AI数字人直播系统源码百度SEO排名7-15天上首页

如何用 Python 抓取 javascript 网站？

PHP中文网 • 2025年3月5日 20:04:53 • 编程技术 • 阅读 2

问题内容

我正在尝试抓取一个网站。我尝试过使用两种方法，但两种方法都没有为我提供我正在寻找的完整网站源代码。我正在尝试从下面提供的网站 url 中抓取新闻标题。

网址：“https://www.todayonline.com/”

这是我尝试过但失败的两种方法。

方法一：美汤

tdy_url = "https://www.todayonline.com/"page = requests.get(tdy_url).textsoup = beautifulsoup(page)soup  # returns me a html with javascript textsoup.find_all('h3')### returns me empty list []

登录后复制

方法2：selenium + beautifulsoup

tdy_url = "https://www.todayonline.com/"options = Options()options.headless = Truedriver = webdriver.Chrome("chromedriver",options=options)driver.get(tdy_url)time.sleep(10)html = driver.page_sourcesoup = BeautifulSoup(html)soup.find_all('h3')### Returns me only less than 1/4 of the 'h3' tags found in the original page source

登录后复制

请帮忙。我尝试过抓取其他新闻网站，这要容易得多。谢谢。

立即学习“Java免费学习笔记（深入）”；

正确答案

您可以通过 api 访问数据（查看“网络”选项卡）：

例如，

import requestsurl = "https://www.todayonline.com/api/v3/news_feed/7"data = requests.get(url).json()

登录后复制

以上就是如何用 Python 抓取 javascript 网站？的详细内容，更多请关注【创想鸟】其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至253000106@qq.com举报，一经查实，本站将立刻删除。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2530725.html

赞 (0)

0 0

关于作者

PHP中文网签约作者

364.0K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Python BOT 从 Excel 工作表中提取长列并创建一个数据框来对另一个文件中的一些数字进行编目

上一篇 2025年3月5日 20:04:48

golang框架架构如何实现高并发处理？

下一篇 2025年3月1日 03:32:22

编程技术

Selenium截图：PNG与JPG格式差异及内存处理方法是什么？

Selenium截图：PNG、JPG格式差异及内存优化 Selenium自动化测试中，截图格式选择至关重要。Selenium WebDriver 提供 get_screenshot_as_png 和 get_screenshot_as_ba…

PHP中文网
2025年3月5日
2000
编程技术

Selenium无头模式：如何在登录后切换？

selenium无头模式切换时机详解及解决方案许多Selenium用户在学习过程中会遇到一个难题：如何在Selenium启动浏览器后，再切换到无头模式？大多数教程都在启动浏览器时就设置了无头模式，例如： options = webdriv…

PHP中文网
2025年3月5日
2000
编程技术

Selenium登录后如何切换到无头模式？

Selenium：登录后切换至无头模式的探讨许多Selenium教程都演示了如何在浏览器启动时启用无头模式，例如： options = webdriver.ChromeOptions()options.add_argument(‘–he…

PHP中文网
2025年3月5日
2000
编程技术

Selenium中：为什么迭代find_elements_by_css_selector方法返回的元素会报错？

Selenium元素查找迭代错误：剖析cannot unpack non-iterable WebElement object 在Selenium自动化测试中，常需遍历多个元素。本文分析find_elements_by_css_select…

PHP中文网
2025年3月5日
2000
编程技术

Selenium登录后能否切换为无头模式？

Selenium：登录后切换至无头模式的可行性分析许多Selenium教程展示了在启动ChromeDriver时设置无头模式的方法，例如： options = webdriver.ChromeOptions()options.add_ar…

PHP中文网
2025年3月5日
2000
编程技术

Selenium登录后如何切换无头模式？

Selenium：登录后切换无头模式的可能性探讨多数Selenium教程都在启动ChromeDriver时就设置无头模式，例如： options = webdriver.ChromeOptions()options.add_argumen…

PHP中文网
2025年3月5日
2000
Selenium显式等待失效：图片上传后“删除”按钮无法定位的原因及解决方法？

selenium 中的隐式等待与显式等待在使用 selenium 自动化测试的过程中，常常需要等待页面元素加载完成才能进行后续操作。这篇文章将针对一个关于 selenium 条件等待（显式等待）失效的问题进行分析，并尝试给出解决方案。问…

PHP中文网
编程技术 2025年3月5日
2000
编程技术

Selenium中如何获取WebElement的不可见文本？

Selenium 获取网页元素文本的技巧：应对可见与不可见文本在使用 Selenium 自动化测试时，提取网页元素文本至关重要。本文将探讨如何有效获取元素文本，特别是处理那些默认情况下不可见的文本内容。挑战：webelement.tex…

PHP中文网
2025年3月5日
2000
编程技术

Python Selenium自动化操作：如何准确定位和点击网页超链接？

Selenium自动化测试中，精准定位和点击网页链接是常见挑战。本文以百度搜索结果页为例，分析并解决Selenium定位链接时遇到的难题：程序点击搜索结果页第一个链接后跳转，再点击新页面第一个链接却返回原页面的问题。问题根源在于页面异步加…

PHP中文网
2025年3月5日
2000
编程技术

Selenium WebDriver如何获取网页中不可见的元素文本？

Selenium WebDriver：巧妙获取网页隐藏元素文本在使用Selenium进行网页自动化测试时，提取网页元素文本是常见操作。本文基于Python和Selenium 4.4.3版本，详细讲解如何获取WebElement文本，尤其针…

PHP中文网
2025年3月5日
2000

发表回复

登录后才能评论