开发者

Python数据分析基础之文件的读取

开发者 https://www.devze.com 2022-12-07 10:44 出处:网络 作者: 生生世世酒
目录一Numpy库中操作文件1.操作csv文件2.在pycharm中操作csv文件3.其他情况(.npy类型文件)二Pandas库中操作文件1.操作csv文件2.从剪贴板上复制数据3.读取excel或xlsx文件三补充1.常用2.pandas中读取文件的函数总结前
目录
  • 一Numpy库中操作文件
    • 1.操作csv文件
    • 2.在pycharm中操作csv文件
    • 3.其他情况(.npy类型文件)
  • 二Pandas库中操作文件
    • 1.操作csv文件
    • 2.从剪贴板上复制数据
    • 3.读取excel或xlsx文件
  • 三补充
    • 1.常用
    • 2.pandas中读取文件的函数
  • 总结

    前言:如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库

    一Numpy库中操作文件

    1.操作csv文件

    import numpy as np
    a=np.random.randint(0,10,size=(3,4))
    np.savetext

    编程客栈

    ("score.csv",a,deliminter=",")

    a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名

    或者

    import numpy as np
    data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)

    skiprows:跳过第一行,dtype:数据读出的类型为字符型

    2.在pycharm中操作csv文件

    import csv
    with open("score.csv",'r')as fp:
    reader=csv.reader(fp)
    for x in reader:
         print(x)

    reader:迭代器

    3.其他编程客栈情况(.npy类型文件)

    import numpy as np
    c=np.random.randint(0,10,size=(2,3))
    np.save("文件名",c)
    c1=np.load("文件名.npy")

    二Pandas库中操作文件

    1.操作csv文件

    import pandas as pd
    df=pd.read_csv("exl.csv")

    或者

    import pandas as pd
    pd.read_table("exl.csv",sep=',')

    sep:分隔符

    2.从剪贴板上复制数据

    import pandas as pd
    BS=pd.read_clipboard

    3.读取excel或xlsx文件

    import pandas as pd
    df=read_excel("exl.xlsx")

    三补充

    1.常用

    import os
    os.chdir()

    chdir()中写上你想读取文件的目录,表示将目录转化到你想读取文件的目录.

    2.pandas中读取文件的函数

    • read_csv 从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为逗号
    • read_table同上,但默认分隔www.cppcns.com符为制表符(“t”)
    • read_fwf 读取定宽列格式数据(无分隔符)
    • read_clipboard 读取剪贴板中的数据
    • read_e

      http://www.cppcns.com

      xcel
      从Excehttp://www.cppcns.coml 或xlsx文件中读取表格数据
    • read_hdf读取pandas写的HDF5文件
    • read_html 读取html文档中的所以表格
    • read_json 读取json字符串中的数据
    • read_msgpack 二进制格式编码的pandas数据
    • read_pickle 读取python pickle 格式中存储的任意对象
    • read_sas读取存储于SAS系统自定义存储格式为SAS数据集
    • read_sql读取SQL查询结果为pandas的DataFrame
    • read_stata 读取stata文件格式的数据集

    总结

    本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注我们的更多内容!

    0

    精彩评论

    暂无评论...
    验证码 换一张
    取 消

    关注公众号