Jupyter Notebooks 作为端到端分析解决方案

介绍

你醒了。您查看待办事项列表,发现团队成员有一项任务。他们希望您进行某种分析并生成报告。请求本身相对复杂,这意味着您可能需要使用问题陈述对其进行分解,从数据源中提取数据,进行探索,收集您的见解,然后向团队成员讲述您的发现故事。

解决这个问题的方法如下:

在任务跟踪平台(例如 Trello、Jira)中构建问题陈述从数据源(例如 SQL 数据库,使用 SSMS、Power Query 等接口)提取数据在分析工具(Python、R、Excel)中执行探索性数据分析和复杂转换确定见解,然后以易于理解的方式将其呈现给麻瓜(一个幻灯片,或者如果您感兴趣的话,可以使用 Tableau 或 Power BI 等可视化工具)

听起来像是数据专业人员生活中的标准一天,对吗?然而,我不知道你怎么想,但在这么多工具之间移动数据可能会让人非常迷失方向。它导致工作流程效率非常低。但如果我告诉你有更好的方法呢?您可以在一个地方准备问题陈述、编写 SQL 查询、执行分析并呈现您的发现吗?如果您使用数据和 Python,您可能已经熟悉 Jupyter Notebook 作为临时分析的优秀工具。 Notebook 的交互式环境允许进行顺序分析和讲故事。但 Notebook 的魅力不仅仅在于它与 IPython 的结合。 Jupyter Notebook 本质上是使用 HTML、CSS 和 JS 构建的;这意味着我们可以利用这些技术来扩展笔记本的功能。在本文中,我将向您展示如何利用 Jupyter Notebook 的 Web 界面和 Python 丰富的数据库来构建端到端报告解决方案。

为了继续进行操作,您需要在系统上安装以下软件和/或软件包:

SQL Server:这是我们将与之交互以进行数据提取的 SQL 方言
Aventure Works 数据库:这是我们将从中查询数据的数据库集合。默认情况下,AW 数据库通常随 SQL Server 安装一起提供。但如果没有,请单击链接并按照有关如何将其加载到 SQL Server 安装中的说明进行操作。
Python 和 Jupyter :同时安装 Python 和 Jupyter 的最简单方法是使用 anaconda 发行版。如果您已经拥有 Python 但只想安装 Jupyter,请使用此链接。
Python 库:

pyodbc熊猫sqlalchemy情节mlxtend网络x

现在我们已经解决了这个问题,让我们直接进入 Jupyter Notebook。您可以在下面找到它:

注意:上面的嵌入来自 github 存储库,您可以在此处克隆。但是,因为它托管在 github 上,所以所有 JS 交互性都被禁用,因此“切换按钮”将不会被渲染。但是,如果您将存储库克隆到您的计算机并在本地运行笔记本,您将看到该按钮将如下所示:

Jupyter Notebooks 作为端到端分析解决方案

通过单击“切换按钮”,输入单元格将被隐藏,您将看到如下内容:

Jupyter Notebooks 作为端到端分析解决方案

就是这样。总之,这是我们在一个环境(笔记本)中能够完成的所有操作:

定义问题陈述并扩展目标直接连接到 SQL 数据库并从中查询数据执行我们的分析绘图可视化使用 Markdown 格式化我们的章节、布局和结果来讲述故事,并使非技术受众也能阅读我们的报告提供隐藏我们技术输入的功能,只留下我们的故事和见解

完整的端到端分析工作流程,全部在一个环境中。下一步将是构建一个框架、技术和/或管道,使我们能够与利益相关者无缝地分享我们的报告。如果这篇文章得到足够的关注,我会在下一篇写这篇文章。 ?

以上就是Jupyter Notebooks 作为端到端分析解决方案的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2196288.html

(0)
上一篇 2025年2月25日 21:41:00
下一篇 2025年2月25日 21:41:15

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • java编程接口怎么起头

    Java 编程接口 (API) 是一组预定义的方法和类,用于在应用程序中利用其他软件的的功能。开始使用 API 的步骤包括:了解 API 文档、导入 API、创建 API 对象、调用 API 方法和处理结果。例如,Java Collecti…

    2025年4月2日
    100
  • java怎么调用python

    通过 Jython、JPython、Hadoop Pig 或 Java Native Interface (JNI),可以从 Java 调用 Python 代码,各方法各有优势和劣势,具体选择取决于用例和要求。 如何从 Java 调用 Py…

    2025年4月2日
    100
  • java转python怎么转

    java 转 python 如何从 Java 转到 Python? 从 Java 转到 Python 的过程需要考虑以下步骤: 1. 学习 Python 基础 理解 Python 语法、数据类型、控制流和函数。了解 Python 的包和库生…

    编程技术 2025年4月2日
    100
  • java框架在人工智能和机器学习项目中的应用

    java 框架在人工智能和机器学习项目中的应用java 框架为 ai/ml 解决方案提供了强大的工具和库,流行的框架包括 tensorflow、pytorch、h2o.ai 和 weka。例如,使用 tensorflow,开发者可以创建图像…

    2025年4月2日
    100
  • Dubbo 在微服务架构中的应用场景与优势?

    微服务最佳选择:dubbo轻量级且高性能的 dubbo 框架是微服务架构的首选,支持多种语言并提供分布式系统开发所需的功能。其优势包括高性能、可扩展性、易用性和庞大的生态系统。在实战中,dubbo 可用于构建分布式系统,通过服务解耦和异构系…

    2025年4月2日
    100
  • 如何使用开源替代品替代现有java框架?

    如何使用开源替代品替代现有 java 框架?识别要替换的框架,明确其功能和局限性。探索开源平台,寻找具有类似功能的开源框架,考虑社区支持和许可条款。评估替代品,进行性能测试、特性比较和兼容性检查。制定迁移计划,包括测试、实施和回滚策略。分阶…

    2025年4月2日
    100
  • 最佳的开源替代品在哪些行业和用例中使用?

    开源替代品广泛应用于各个行业,提供与专有软件相当的功能,成本和限制更低。这些应用包括云计算、数据库、办公套件、操作系统和开发工具。例如,金融行业使用开源替代品创建了风险管理系统,降低了成本并提高了灵活性。随着开源软件的成熟,其采用范围预计将…

    2025年4月2日
    100
  • java可变参数怎么遍历

    Java的可变参数(变长参数)允许函数接受任意数量的参数。遍历这些参数的语法:for (数据类型 参数名 : 可变参数) { // 遍历可变参数的每个元素} Java 可变参数遍历 Java 中的可变参数(也称为变长参数)允许函数接受任意数…

    2025年4月2日
    100
  • java框架如何赋能人工智能发展?

    java 框架通过以下方式赋能 ai:数据管理和处理:spark、hadoop 和 tensorflow data 用于处理和存储 ai 数据。机器学习和深度学习:tensorflow、scikit-learn 和 opencv 用于构建和…

    2025年4月2日
    100
  • 分布式事务处理中的异步处理与补偿机制

    分布式事务处理中,异步处理可提升效率,将事务操作分解成可并行执行的异步任务;补偿机制则提供失败后的恢复手段,定义了任务失败时执行的步骤确保事务一致性。实战案例中,如订单处理系统可通过分解任务提升处理速度,用户注册系统可使用补偿机制在验证失败…

    2025年4月2日
    100

发表回复

登录后才能评论