V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hujianxin
V2EX  ›  程序员

pandas read_csv 如何指定部分(前 n 个)seperator

  •  
  •   hujianxin · 2019-01-25 17:10:10 +08:00 · 1373 次点击
    这是一个创建于 2125 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如我的 csv 文件是这样的

    age,first_name,other
    12,hello,world,john
    13,hi,csv,lili
    

    如上面所示,第一行有使用逗号分割了三个元素,第二、三行使用逗号分割了四个元素。

    现在需求是通过 pandas 读入 csv 文件,成为一个 Dataframe,形式如下:

    age   first_name     other
    12    hello          world,join
    13    hi             csv,lili
    

    这种需求 pandas 能实现吗?希望使用过的大佬可以帮忙解惑,多谢!

    1 条回复    2019-01-26 00:00:21 +08:00
    habin
        1
    habin  
       2019-01-26 00:00:21 +08:00
    可以的,other 是 world、csv 的表头,john,lili 没有表头的通过读取后可以直接字符串连接
    data = pd.read_csv('1.csv')
    data['other'] = data['other'] +',' +data['Unnamed: 3'] # 'Unnamed: 3'为 john、lili 的表头
    data.drop('Unnamed: 3',axis = 1,inplace = True)
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 09:05 · PVG 17:05 · LAX 01:05 · JFK 04:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.