tutorial 里面用的都是内置的数据,我不是太明白怎么把自己的数据给他。
我的数据集是这样的
39,State-gov,Bachelors,Never-married,Adm-clerical,Not-in-family,White,Male,2174,0,40,United-States,0
50,Self-emp-not-inc,Bachelors,Married-civ-spouse,Exec-managerial,Husband,White,Male,0,0,13,United-States,0
对应
请问我该怎样用 sklearn 来导入这组数据呢?
1
billgreen1 2016-01-10 09:37:25 +08:00
推荐用 pandas , 可以读取 csv ,数据库,...,各种数据源。
读取后,是一个 dataframe , 有一个.values 属性,返回的是一个数组。 |
2
KIDJourney OP |
3
staticor 2016-01-10 13:33:00 +08:00 2
|
4
sleeperqp 2016-01-10 14:06:18 +08:00 1
@KIDJourney 可以的 你去看下 pandas 例子就知道
|
5
KIDJourney OP |
6
sleeperqp 2016-01-10 19:44:55 +08:00
用 pandas 读完 csv 然后放入 numpy 就可以了~ 具体的你可以看看例子
|
7
yech1990 2016-01-10 22:01:43 +08:00 1
|
8
KIDJourney OP @yech1990 好的。多谢
|
9
billgreen1 2016-01-11 13:13:52 +08:00
@yech1990 sklearn 不依赖 pandas ,是依赖 scipy 的。
|
10
Michael728 2016-01-13 14:02:17 +08:00
@sleeperqp 发现这里真是什么大牛都有呀。最近在学 python ,但是数据分析入门感觉挺慢。/(ㄒoㄒ)/~~
|
11
sleeperqp 2016-01-13 15:02:10 +08:00
@Michael728 我也是新手弱弱 0 0 多写就好了 最好找点东西做 比如去 kaggle 上找个比赛做做 这样做得快 我觉得主要还是对数据的跟算法的两个理解结合起来才能做好这件事
|
12
KIDJourney OP @Michael728 我现在也只是套模型而已,建议先用这些东些做出点东西,有了成就感,再去深入了解底层的知识,这样比较好。
|