python数据分析第一步:读取以及查看数据

 

用python做数据分析第一步,通常会遇到需要将现成文件(数据库里导出来,或者其他情况下获得的各种文件)拿来处理分析的情况,下面来说下利用python的标准库pandas来读取以及查看数据的方法

1、文件读取

首先将用到的pandas和numpy加载进来

import pandas as pd

import numpy as np

读取数据:

#csv和xlsx分别用read_csv和read_xlsx,下面以xlsx

 

为例

df=pd.read_csv('f:\1024.csv') 

有时产生报错是因为斜杠的问题:改成双斜杠就可以

df=pd.read_csv('D:\\py\\python\\data\\xx1106.csv')


2、查看数据

df.head()  

#默认出5行,括号里可以填其他数据

标题栏如果是中文产生了乱码,如何解决?

3、查看数据类型

df.dtypes

4、利用现有数据生成一列新数据

比如:max_time和min_time是现有的两列,现在业务需要生成一列gs,gs=max_time-min_time

df.['gs']=df.['max_time']-['min_time']

#查看是否成功

df.head()

5、查看基本统计量

df.describe(include='all')  # all代表需要将所有列都列出

 

好了,今天就这么多了,以上代码都运行检验过

---------------以上于16年11月

------------以下于19年7月1日--

用read_table读文件,无论txt还是csv都可以读,指定encoding='gb2312'可以中文乱码的问题

import pandas as pd
data = pd.read_table('D:\\py\\python\\data\\theme_revenue1106.csv',encoding='gb2312', sep=',')

读CSV文件

 

读txt文件

youmayangguang
关注 关注
  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Python数据分析实战:交通出行数据分析
程序员光剑
02-21 690
随着城市化进程的加快,交通出行问题日益成为城市管理者和居民关注的焦点。交通拥堵、不合理的交通设施布局、交通事故等问题不仅影响居民的生活质量,也给城市的经济发展带来了负面影响。通过对交通出行数据的分析,可以帮助城市管理者更好地理解交通现状,制定科学的交通管理政策,提高交通系统的效率和安全性。在交通出行数据分析中,常用的算法包括回归分析、聚类分析、时间序列分析等。回归分析主要用于建立交通流量、交通密度、平均车速等变量之间的关系模型;聚类分析主要用于识别交通事故多发区域;
Python数据分析实战:物流业数据分析
程序员光剑
02-19 737
在当今快速发展的全球经济中,物流业作为连接生产和消费的重要纽带,正面临着前所未有的机遇与挑战。随着电子商务的蓬勃发展和消费者对快速、高效配送的需求不断增长,物流公司需要更智能、更精准的决策支持系统来优化其运营流程、提高服务质量并降低成本。然而,物流业每天产生的海量数据往往未被充分利用,其中蕴含的巨大价值尚待挖掘。这些数据包括但不限于订单信息、配送路线、车辆状态、仓储管理等各个环节的详细记录。如何有效地收集、处理、分析这些数据,并从中提取有价值的洞察,成为了物流业亟待解决的关键问题。
如何用Python进行数据分析
qq_46094651的博客
03-14 1983
1、提出问题,明确数据指标及对应的计算公式:月均消费次数、月均消费金额、客单价、消费趋势2、理解数据(1)读取Excel数据(2)查看前五行数据(3)查看共有几行几列数据(4)查看列的数据类型(5)获取描述统计信息(1)此数据分析不需要选择子集(2)列名重命名(3)缺失数据的处理(4-1)数据类型的转换:将字符串转换为数值型(4-2)日期型数据的处理(5)排序(6)删除异常值4、计算业务指标(1)月均消费次数=总消费次数/月份数:总消费次数指同一天内同一个人发生的所有消费算作一次消费。
Python数据分析入门(1)——数据分析基础步骤知识
tianshijie08的博客
08-22 2450
夜曲编程笔记
python 读取sql文件并解析内容
最新发布
weixin_41430022的博客
07-29 169
python相关学习资料:https://edu.51cto.com/video/3502.htmlhttps://edu.51cto.com/video/4645.htmlhttps://edu.51cto.com/video/4102.htmlPython 读取 SQL 文件并解析内容 作为一名刚入行的开发者,你...
python如何查询数据库_如何进行python数据库查询?(实例解析)
weixin_39820588的博客
11-24 1169
在这篇文章之中我们来了解一下关于python数据库的相关知识,有些朋友可能是刚刚接触到python这一编程语言,对这一方面不是特别的了解,在接下来这篇文章将会来带大家来了解关于python查询数据库中数据的相关知识。数据库的查询操作Python查询Mysql使用 fetchone() 方法获取单条数据, 使用fetchall() 方法获取多条数据。1.fetchone(): 该方法获取下一个查询结...
Python数据分析步骤(入门学习)
qq_53011270的博客
11-01 1397
Python数据分析步骤
如何使用Python进行数据分析
weixin_66623438的博客
06-01 570
Python支持读取各种类型的数据文件,如CSV、JSON、Excel和SQL数据库等。以上只是Python进行数据分析的基础知识,还有更多高级技术和库可以使用,如Scikit-learn、TensorFlow和PyTorch等。在数据分析过程中,数据清洗和处理是不可避免的步骤。Pandas库提供了丰富的函数用于数据清洗和处理。Python的强大之处在于其庞大的生态系统和可扩展性。Matplotlib库提供了丰富的绘图功能,能够生成各种类型的图表,如折线图、散点图、直方图和饼图等。3. 数据清洗和处理。
Python数据分析流程
m0_59485658的博客
03-16 1039
里面有3张csv文件分别是enrollments.csv,daily_engagements.csv,project_submission.csv和一个ipython的notebook。启动cmd 切换到解压之后的文件 输入 jupyter notebook 启动ipython笔记本。3.代码编写,提取出结果数据,并分析是否有异常数据,修改代码。6.追踪剩余的问题(移除数据集的测试账号)4.根据数据选择合适的图表进行展示。10.区分项目通过的学生。11.对比两组学生的数据。3.修改数据中的格式问题。
从Excel到Python数据分析进阶指南1
08-04
首先,生成数据表是数据分析第一步。在Python中,我们可以使用pandas库的DataFrame对象来创建数据表。例如,通过`pd.DataFrame(pd.read_csv('name.csv', header=1))`,你可以读取CSV文件并将其转换为DataFrame。 ...
牛客python数据分析代码笔记
04-10
Python数据分析过程中,数据处理是非常重要的第一步,它包括数据导入、数据清洗以及数据转换等环节。接下来将详细介绍几个关键步骤。 ##### 1. 数据导入 数据导入是数据分析第一步,常用的库是Pandas,通过`...
Python实时显示数据
07-21
实时显示数据对于数据采集,分析系统都是非常必要的。Python作为一种非常常用的语言,能够在各种不同平台上方便的使用。 在这个例子中,我使用简单的基础函数实现数据的实时显示。
python数据分析期末复习
06-29
需求分析是数据分析第一步和最重要的步骤,决定了后续的分析方向和方法。数据获取是指根据需求分析的结果提取和收集数据数据预处理是指对数据进行合并、清洗、变换和标准化,使得整体数据变为干净整齐,可以直接...
Python数据分析——数据读取
m0_70816190的博客
12-13 228
变量类型反映了其代表事物的某种特征数值型变量定类型变量定序形变量。Python数据分析——数据读取
Python 数据呈现
xddayz的博客
06-08 600
数据呈现数据呈现采用词频统计和词云展示,通过词频可以了解到微信好友的生活态度。词频统计用到了 jieba、numpy、pandas、scipy、wordcloud库。如果电脑上没有这几个库,执行安装指令:pip install jiebapip install pandaspip install numpypip install scipypip install wordcloud4.2.1 读取...
Python数据分析高薪实战第五天 文件数据读取查看
fegus的博客
05-04 788
11 文件处理:如何读取多种文件(cvexcel)的数据? 从今天开始,我们进入了一个新的部分:使用 pandas 进行数据处理。在上一个模块我们学习了爬虫技术,并学会了怎么将数据从网页中抓取出来保存成 csv 数据集。 在有了数据集之后,接下来我们就开始学习怎么把数据集的内容加载到 Python 中。虽然我们在上一个模块学过简单的读取 csv 的文件内容。 但是存在两个问题: 只能读取 csv 文件,但数据分析数据除了可能来自 csv,也可能来自 Excel,甚至可以来自 html 的表格。
python数据可视化显示
To be a better man
04-20 807
#!/usr/bin/python # -*- coding: UTF-8 -*- import numpy as np from statistics import mean from scipy import stats import statistics import matplotlib.pyplot as plt common_path_1 = "/home/tage/lidar_annotation/_label/" common_path_2 = "snow/01/" label_txt .
Python数据分析基础之数据库(1)
CCH²¹的博客
02-10 541
  SQL(Structured Query Language),表示结构化查询语言,是一组应用广泛的与数据库交互的命令。要学习如何使用Python数据库交互,首先我们要有一个数据库,并且数据库中要有一张充满数据的表。有两种资源可供我们选择:一是Python的内置模块sqlite3,它可以创建内存数据库,我们不用下载安装专门的数据库软件;二是MySQL、PostgreSQL或Oracle这样的常...
Python更漂亮的显示数据
知智
04-18 4425
使用pprint模块中的pprint函数可以自动将要打印的内容进行调整,使得输出的内容比较方便查看
写文章

热门文章

  • np.dot函数 29942
  • python数据分析第一步:读取以及查看数据 23401
  • np.where使用:根据条件生成新的数组 16925
  • python替换缺失值,处理空值+生成图形+图形标准化 16779
  • python列表操作-赋值 12233

最新评论

  • android studio:aar文件出现问号,导入不生效解决

    昨日D书生: 请问是如何操作的? 把默认类型txt 改为 archive类型的?

  • 用python判断闰年

    松少吖: 输出不了呀

  • python替换缺失值,处理空值+生成图形+图形标准化

    dengqiangjiayou: 看起来感觉有点乱

  • python数据分析第一步:读取以及查看数据

    现实太残忍: 查看前5行的前三列怎么操作呢

  • np.dot函数

    ghost889 回复 Mr__Buger: 对,一维时是内积

最新文章

  • 崩溃疑似ANR排查
  • Execution failed for task ‘:compileDebugJavaWithJavac‘. java.lang.IllegalArgumentException: ‘_‘ may
  • resource android:attr/dialogCornerRadius not found
2021年6篇
2020年4篇
2019年4篇
2017年1篇
2016年17篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家常德玻璃钢雕塑制作价格太原玻璃钢雕塑现货杭州抽象玻璃钢雕塑订做价格仙桃玻璃钢雕塑考拉厂家青岛商场主题创意商业美陈江苏玻璃钢景观雕塑湖南玻璃钢雕塑设计都匀玻璃钢雕塑设计玻璃钢卡通机器人雕塑茂名玻璃钢卡通模型雕塑家居玻璃钢花盆厂家梧州玻璃钢雕塑作品赣州抽象玻璃钢雕塑生产厂家淮北环保玻璃钢雕塑批发上海大型商场美陈哪里买云浮玻璃钢雕塑哪家便宜玻璃钢雕塑如何电镀温州创意玻璃钢雕塑定做价格玻璃钢雕塑的保养和维护遵义玻璃钢雕塑厂有哪些洛阳不锈钢镂空玻璃钢卡通雕塑龙岩玻璃钢牌匾雕塑玻璃钢雕塑的功能强大玻璃钢雕塑有点吉林户外玻璃钢雕塑方法巢湖市玻璃钢雕塑厂家兰州玻璃钢雕塑采购玻璃钢雕塑和石膏雕塑玻璃钢雕塑的种类福建装饰商场美陈批发香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化