本站消息

站长简介/公众号


站长简介:逗比程序员,理工宅男,前每日优鲜python全栈开发工程师,利用周末时间开发出本站,欢迎关注我的微信公众号:幽默盒子,一个专注于搞笑,分享快乐的公众号

  价值13000svip视频教程,python大神匠心打造,零基础python开发工程师视频教程全套,基础+进阶+项目实战,包含课件和源码

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

在 pandas read_csv 中加载数据时的操作顺序

发布于2021-06-04 04:38     阅读(367)     评论(0)     点赞(16)     收藏(1)



dtype在应该被skiprows参数排除的行上出错 那么,在跳过行之前发生数据类型验证/强制是否正确?有没有办法绕过此类要跳过的行上的错误?

同样,什么时候converters应用?这种依赖顺序的操作的流程图会很有帮助。

这是示例:

from io import StringIO
data = StringIO("i,a,b\ngood,1,2\nbad,3,a"), 
pd.read_csv(data, index_col='i',skiprows=lambda index: 'bad' == index, dtype={'b':float})

以上抛出

ValueError: could not convert string to float: 'a'

不跳过数据应该是:

    a, b
--------
good 1, 2
bad  3, a

跳过后,我期待

    a, b
---------
good 1, 2

更新: 似乎也与这个关于 dtype/index_col 不同步的错误有关。


解决方案


暂无回答






所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/983432/8945498eaf2f0e2cfc5f/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

16 0
收藏该文
已收藏

评论内容:(最多支持255个字符)