本站消息

站长简介/公众号


站长简介:逗比程序员,理工宅男,前每日优鲜python全栈开发工程师,利用周末时间开发出本站,欢迎关注我的微信公众号:幽默盒子,一个专注于搞笑,分享快乐的公众号

  价值13000svip视频教程,python大神匠心打造,零基础python开发工程师视频教程全套,基础+进阶+项目实战,包含课件和源码

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

我们如何在每次运行代码时使用我们的数据集而不加载它?

发布于2021-07-23 03:19     阅读(181)     评论(0)     点赞(2)     收藏(1)



我有一个出租车需求预测的项目,数据是12GB的csv文件,1.31亿条记录。预处理数据后,我想将其保存为泡菜或其他东西。我正在尝试泡菜但它不起作用,我不知道是什么问题!

我的一些代码行:

my_data=dd.read_csv(taxi_data.csv', parse_dates ['tpep_pickup_datetime', 'tpep_dropoff_datetime'])

with open('mydatapick.pickle', 'wb') as f:
    pickle.dump(my_data,f)

pickle_in=open('mydatapick.pickle', 'rb')
my_data=pickle.load(pickle_in)

解决方案


暂无回答






所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/1003963/246c94cd3bebd5d33e35/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)