广告区
广告区
关注本站官方公众号:程序员总部,领取三大福利!
福利一:python和前端辅导
福利二:进程序员交流微信群,专属于程序员的圈子
福利三:领取全套零基础视频教程(python,java,前端,php)
发布于2022-01-05 06:24 阅读(795) 评论(0) 点赞(19) 收藏(1)
数据预处理是数据科学管道的重要组成部分,需要找出数据中的各种不规则性,操作您的特征等。 Pandas 是我们经常使用的一种工具,用于处理数据,还有 seaborn 和 matplotlib用于数据可视化。PandasGUI 是一个库,通过提供可用于制作
使用pip 命令像安装任何其他 python 库一样安装 PandasGUI。相同的命令是:
pip install pandasgui
要在 PandasGUI 中读取 文件,我们需要使用show()函数。让我们从将它与 pandas 一起导入开始。数据集是titanic
import pandas as pd
from pandasgui import show
from pandasgui.datasets import titanic
show(titanic)
这是我们的数据框,我们可以滚动查看数据。可以看到表示 NaN 值的空单元格。可以通过单击单元格并编辑其值来编辑数据。只需单击特定列即可根据特定列对数据框进行排序。在下图中,我们可以通过单击fare
列对数据框进行排序。
假设我们想查看 MSSubClass 的值大于或等于 120 的行。在 Pandas 中,我们可以使用以下命令:
titanic[titanic['age'] >= 20]
PandasGUI 为我们提供了过滤器,可以在其中编写查询表达式来过滤数据。上述查询表达式将是:
汇总统计数据为您提供了数据分布的概览。在pandas中,我们使用describe()方法来获取数据的统计信息。
titanic.describe()
在 PandasGUI 中,可以转到统计部分并获取每列的统计信息。
数据可视化通常不是 Pandas 的用途,我们使用 matplotlib、seaborn、plotly 等库。但 PandasGUI 在 Grapher 部分下提供了使用 plotly 绘制的交互式图形。
我们通过将fare拖放到x下来创建fare的直方图。
除了这些,还可以创建箱线图、3d 散点图、线图等。如果您想快速概览数据,从检查汇总统计数据到绘制数据,PandasGUI 是一个很好的工具,可以轻松完成,无需代码。
原文链接:https://blog.csdn.net/weixin_44510615/article/details/122300137
关注本站官方公众号:程序员总部,领取三大福利!
福利一:python和前端辅导
福利二:进程序员交流微信群,专属于程序员的圈子
福利三:领取全套零基础视频教程(python,java,前端,php)
关注公众号回复python,免费领取 全套python视频,回复充值+你的账号,免费为您充值1000积分
作者:676yyj
链接:https://www.pythonheidong.com/blog/article/1219678/055382542a9bfe59094a/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!