Python中简单统计量的计算

本篇文章给大家带来的内容是关于python中简单统计量的计算,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

1、这些操作都要确保已经在电脑中安装好了Anaconda集成库,如果安装好后运行出错误,可以将原来电脑中的python卸载重新安装Anaconda,建议安装时直接将添加环境变量打勾,否则以后得自己添加环境变量,在Pycharm中的编译器选择Anaconda安装文件夹中的python。在Pycharm中新建一个data文件夹用来存放数据文件。

3830482004-5c3b25350886f_articlex.png

2.打开Python Console。

3.首先在用python读取数据,需要先输入import pandas as pd引入pandas包,再输入df=pd.read_csv(“./data/CityData.csv”)读取数据,最后输入df显示数据。

立即学习“Python免费学习笔记(深入)”;

3955790866-5c3b25352ca85_articlex.png

4.分别输入type(df)和type(df[“cid”])可以发现两种数据类型不同。

3284422015-5c3b2534deeca_articlex.png

17036064-5c3b25349dc53_articlex.png

5.计算平均值:df.mean()或df[“xid”].mean()

1628955455-5c3b25349476d_articlex.png

6.计算中位数:输入df.median()或df[“yid”].median

3147096682-5c3b2534903b8_articlex.png

7.求四分位数:输入df.quantile(q=0.25)

4028150033-5c3b25348c031_articlex.png

8.求众数:输入df.mode()或df[“xid”].mode()

9.求标准差:输入df.std()或df[“yid”].std()

1160560863-5c3b25348e9f2_articlex.png

10.计算方差:df.var()或df[“xid”].var()

877557316-5c3b253456c9c_articlex.png

11.求和:df.sum()或df[“xid”].sum()

3435427316-5c3b253426418_articlex.png

12.计算偏态系数:df.skew()或df[“yid”].skew()

2231008089-5c3b253403194_articlex.png

13.计算峰态系数:df.kurt()或df[“yid”].kurt()

1748583511-5c3b2533ebcf8_articlex.png

14.生成正态分布函数,pandas无法直接生成,需要先引入scipyimport scipy.stats as ss,再输入ss.norm,这时生成的是一个正态分布的对象,我们输入ss.norm.stats(moments=”mvsk”)查看一下,mvsk分别代表的是均值、方差、偏态系数、峰态系数。

1052923731-5c3b2533e60c2_articlex.png

这时我们可以看到生成四个值,分别对应正态分布的mvsk分别为0、1、0、0。

15.ss.norm.pdf(0.0)表示横坐标为0时的纵坐标的值。ss.norm.ppf(0.9)表示从负无穷累积到返回值时得到的值为0.9,其中ppf后的值必须在0-1之间。ss.norm.cdf(2)表示从负无穷积分到2时的返回值,ss.norm.rvs(size=10)可以得到10个随机的符合正态分布的数字。

3919396561-5c3b253405fb7_articlex.png

16.类似的,我们可以分别输入ss.chi2和ss.t得到卡方分布和T分布。

3248081667-5c3b2533a64c6_articlex.png

17.此外我们还可以进行抽样,输入df.sample(n=10)从数据中抽取10个样本,输入df.sample(frac=0.1)从数据中抽取10%的样本。

1106816606-5c3b2533d6813_articlex.png

以上就是Python中简单统计量的计算的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2534326.html

(0)
上一篇 2025年3月5日 21:29:02
下一篇 2025年3月5日 21:29:14

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 怎么找到黑客的联系方式?

    如果你想要找到黑客的联系方式,那么你可能面临以下难题:黑客往往会隐藏他们的身份,并且他们的联系方式很难被发现。php小编草莓在这里为你提供了一份指南,旨在帮助你找到黑客的联系方式。在本指南中,我们将介绍一些常见的黑客使用的联系方式,并提供一…

    2025年3月5日
    200
  • 什么是Python和php?Python与PHP有什么区别

    Python和php相信会有很多人都不太了解,下面【创想鸟】就带领大家认识一下Python与PHP区别。 一:什么是Python? Python是一种高级面向对象的编程语言。Python具有内置的数据结构,结合动态类型和绑定,是很多程序开发…

    2025年3月5日
    100
  • python多线程的详细介绍(代码示例)

    本篇文章给大家带来的内容是关于python多线程的详细介绍(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 global interpreter lock(cpython) 同一时刻只有一个线程运行在一个cpu上…

    编程技术 2025年3月5日
    200
  • Python绘制折线图和散点图的详细方法介绍(代码示例)

    本篇文章给大家带来的内容是关于python绘制折线图和散点图的详细方法介绍(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 1、绘制折线图和散点图要用到matplotlib下的pylab,因此我们需要先引入,因为…

    2025年3月5日 编程技术
    200
  • Python绘制直方图及子图的方法分析(代码示例)

    本篇文章给大家带来的内容是关于python绘制直方图及子图的方法分析(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 1、直方图的绘制也需要用到matplotlib下的pylab,只不过在绘制折线图时我们采用的是…

    2025年3月5日
    200
  • Python中KNN算法(k-近邻算法)的详细介绍(附示例)

    本篇文章给大家带来的内容是关于python中knn算法(k-近邻算法)的详细介绍(附示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 KNN算法是一种数据分类算法,以距离样本k个最邻近数据的类别代表样本的类别,因此也叫…

    2025年3月5日 编程技术
    200
  • python实现蒙特卡罗方法(代码示例)

    本篇文章给大家带来的内容是关于python实现蒙特卡罗方法(代码示例),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 蒙特卡罗方法是一种统计模拟方法,由冯·诺依曼和乌拉姆提出,在大量的随机数下,根据概率估计结果,随机数据越…

    2025年3月5日
    200
  • Python的numpy中常用函数的详细介绍

    本篇文章给大家带来的内容是关于python的numpy中常用函数的详细介绍,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 numpy是python中一个与科学计算有关的库,本文将介绍一些常用的numpy函数,使用numpy…

    2025年3月5日 编程技术
    200
  • Python的pandas中常用函数的总结

    本篇文章给大家带来的内容是关于python的pandas中常用函数的总结,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。 pandas是python中的 一个数据处理库,同样在使用的时候我们要先输入import pandas…

    2025年3月5日 编程技术
    200
  • 8年后Python重登2018年度编程语言王座

    近日,全球知名的编程语言流行度排行榜网站tiobe宣布:python成为2018年度编程语言。 这也是继2010年后,时隔8年Python重登编程语言年度排行榜榜首。 TIOBE Python之所以获得这个称号,是因为它在2018年的排名中…

    2025年3月5日 编程技术
    200

发表回复

登录后才能评论