python读取文本数据并转化为DataFrame格式的方法详解

这次给大家带来python读取文本数据并转化为DataFrame格式的方法详解,python读取文本数据并转化为DataFrame的注意事项有哪些,下面就是实战案例,一起来看一下。

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本数据并转化为DataFrame格式的方法详解

需要输出成“file_out”,格式如下:

python读取文本数据并转化为DataFrame格式的方法详解

数据的原格式是“类别:内容”,以空行“”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8import sysfrom pandas import DataFrame  #DataFrame通常来装二维的表格import pandas as pd      #pandas是流行的做数据分析的包#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……dict_data={}#打开文件with open('file_in.txt','r')as df:  #读每一行  for line in df:    #如果这行是换行符就跳过,这里用''的长度来找空行    if line.count('') == len(line):      continue    #对每行清除前后空格(如果有的话),然后用":"分割    for kv in [line.strip().split(':')]:      #按照键,把值写进去      dict_data.setdefault(kv[0],[]).append(kv[1])#print(dict_data)看看效果#这是把键读出来成为一个列表columnsname=list(dict_data.keys())#建立一个DataFrame,列名即为键名,也就是nam,age……frame = DataFrame(dict_data,columns=columnsname)#把DataFrame输出到一个表,不要行名字和列名字frame.to_csv('file_out0.txt',index=False,header=False)

登录后复制

相信看了本文案例你已经掌握了方法,更多精彩请关注【创想鸟】其它相关文章!

推荐阅读:

object怎么转换成float数据

python怎么处理dataframe的时间字段

以上就是python读取文本数据并转化为DataFrame格式的方法详解的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2264222.html

(0)
上一篇 2025年2月27日 08:03:41
下一篇 2025年2月23日 13:15:45

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • python怎样实现百度语音识别api的步奏详解

    这次给大家带来python怎样实现百度语音识别api的步奏详解,python实现百度语音识别api的注意事项有哪些,下面就是实战案例,一起来看一下。 本文实例为大家分享了ython实现百度语音识别的具体代码,供大家参考,具体内容如下 详细百…

    编程技术 2025年2月27日
    200
  • python 实用函数进阶(更新中)

    本篇文章分享的内容是python 实用函数进阶,现在分享给大家,有需要的朋友可以参考一下本篇文章的内容 1.pyhton断言 如何为assert断言语句添加异常参数 assert的异常参数,其实就是在断言表达式后添加字符串信息,用来解释断言…

    编程技术 2025年2月27日
    200
  • Python面向对象之类和实例

    本篇文章给大家分享的内容是关于Python面向对象之类和实例,有着一定的参考价值,有需要的朋友可以参考一下 类和实例 面向对象最重要的概念就是类(class)和实例(instance),必须牢记类是抽象的模板,比如student类,而实例是…

    编程技术 2025年2月27日
    100
  • Python面向对象之继承和多态

    本篇文章给大家分享的内容是关于Python面向对象之继承和多态,有着一定的参考价值,有需要的朋友可以参考一下 在oop程序设计中,当我们定义一个class的时候,可以从某个现有的class继承,新的class称为子类(subclass),而…

    2025年2月27日
    200
  • 关于Python闭包机制的深入理解

    本文以Python为例,深入浅出讲解闭包;根据百度百科的解释,闭包就是能够读取其他函数内部变量的函数,例如在JavaScript中,只有函数内部的子函数才能读取局部变量,所以闭包可以理解成『定义在一个函数内部的函数』;在本质上,闭包是将函数…

    2025年2月27日 编程技术
    200
  • Python面向对象之获取对象信息

    本篇文章给大家分享的内容是关于Python面向对象之获取对象信息,有着一定的参考价值,有需要的朋友可以参考一下 当我们拿到一个对象的引用时,如何知道这个对象是什么类型、有哪些方法呢? 使用type() 首先,我们来判断对象类型,使用type…

    编程技术 2025年2月27日
    200
  • Python面向对象之实例属性和类属性

    本篇文章给大家分享的内容是关于Python面向对象之实例属性和类属性 ,有着一定的参考价值,有需要的朋友可以参考一下 由于python是动态语言,根据类创建实例可以任意绑定属性。 给实例绑定属性的方法是通过实例变量,或者通过self变量: …

    编程技术 2025年2月27日
    200
  • 如何在python环境下操作excel

    本篇文章给大家分享的内容是如何在python环境下操作excel ,有着一定的参考价值,有需要的朋友可以参考一下 一、可使用的第三方库 python中处理excel表格,常用的库有xlrd(读excel)表、xlwt(写excel)表、op…

    编程技术 2025年2月27日
    200
  • 三种常用的python中文分词工具

    本篇文章给大家分享的内容是三种常用的python中文分词工具,有着一定的参考价值,有需要的朋友可以参考一下 这三种分词工具,在这里分享下~ 1.jieba 分词: # -*- coding: UTF-8 -*-import osimport…

    编程技术 2025年2月27日
    200
  • 深入了解python中的协程函数

    本篇文章给大家分享的内容是深入了解python中的协程函数 ,有着一定的参考价值,有需要的朋友可以参考一下 概念: 根据维基百科给出的定义,“协程 是为非抢占式多任务产生子程序的计算机程序组件,协程允许不同入口点在不同位置暂停或开始执行程序…

    编程技术 2025年2月27日
    200

发表回复

登录后才能评论