技圈网

当前位置»首页 » Python

用python读取csv文件数据的方法是什么?

    这篇文章给大家分享的是用python读取csv文件数据的方法。小编觉得挺实用的,因此分享给大家做个参考,文中示例代码介绍的非常详细,感兴趣的朋友接下来一起跟随小编看看吧。

        数据保存在csv文件中

    1.从csv文件中读取数据

        参数header=None的有无

        (1)没有header=None――直接将csv表中的第一行当作表头

    # 读取数据
    import pandas as pd
    data = pd.read_csv("data1.csv")
    print(data)
    

        打印结果为:

        (2)有header=None――自动添加第一行当作表头

    # 读取数据
    import pandas as pd
    data = pd.read_csv("data1.csv",header=None)
    print(data)
    

        打印结果为:

    2.数据切割

        (这里根据csv表的格式,将header=None不写)

        (1)获取所有列,并存入一个数组中

    # 读取数据
    import pandas as pd
    data = pd.read_csv("data1.csv")
    # print(data)
    # ①获取所有列,并存入一个数组中
    import numpy as np
    data = np.array(data)
    print(data) # 用户编号  性别  年龄(岁)  年收入(元)  是否购买
    # [[15624510        1       19    19000        0]
    #  [15810944        1       35    20000        0]
    #  [15668575        2       26    43000        0]
    #  [15603246        2       27    57000        0]
    #  [  ...          ...      ...    ...       ...]]
    

        (2)获取指定列的数据,并存入一个数组中
    方法一:从csv文件获取data,data[ ] ――需要考虑数据的维度问题

    # 读取数据
    import pandas as pd
    data = pd.read_csv("data1.csv")
    print(data) # 用户编号  性别  年龄(岁)  年收入(元)  是否购买
    # (1)获取第1列,并存入一个数组中
    import numpy as np
    col_1 = data["用户编号"]  #获取一列,用一维数据
    data_1 = np.array(col_1)
    print(data_1)
    # [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
    #  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
    #  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
    #  15705113 15631159 15792818 15633531 15744529]
    
    # (2)获取第1,2列
    col_12 = data[["用户编号","性别"]]  #获取两列,要用二维数据
    data_12 = np.array(col_12)
    print(data_12)
    # [[15624510        1]
    #  [15810944        1]
    #  [15668575        2]
    #  [15603246        2]
    #  [  ...          ..]]
    

        方法二:usecols=[ ] ―― 直接写入获取的列数

    import pandas as pd
    import numpy as np
    data_1 = pd.read_csv("data1.csv",usecols=["用户编号"])
    data_1 = np.array(data_1)
    print(data_1)
    # [[15624510]
    #  [15810944]
    #  [15668575]
    #  [15603246]
    #  [  ...   ]]
    
    # (2)如获取第1,2列
    data_12 = pd.read_csv("data1.csv",usecols=["用户编号","性别"])
    data_12 = np.array(data_12)
    print(data_12)
    # [[15624510        1]
    #  [15810944        1]
    #  [15668575        2]
    #  [15603246        2]
    #  [  ...          ..]]
    

        方法三:iloc[ ] ――实质就是切片操作

    import pandas as pd
    import numpy as np
    data = pd.read_csv("data1.csv")
    # (1)获取第1列
    data_1 = data.iloc[:,0]
    data_1 =np.array(data_1)
    print(data_1)
    # [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
    #  15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
    #  15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
    #  15705113 15631159 15792818 15633531 15744529]
    
    # (2)获取第1,2列
    data_12 = data.iloc[:,0:2]
    data_12 = np.array(data_12)
    print(data_12)
    # [[15624510        1]
    #  [15810944        1]
    #  [15668575        2]
    #  [15603246        2]
    #  [  ...          ..]]
    
    # 获取最后两列
    data_last = data.iloc[:,-2:]
    data_last = np.array(data_last)
    print(data_last)
    # [[ 19000        0]
    #  [ 20000        0]
    #  [ 26    43000        0]
    #  [ 27    57000        0]
    #  [ ...    ...       ...]]
    

        关于用python读取csv文件数据的方法就介绍到这,本文代码仅供参考,感兴趣的朋友可以了解看看,希望能对大家有帮助,想要了解更多python读取csv文件数据的方法,大家可以关注其它的相关文章。

    文本转载自脚本之家

      免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:本站进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。