机器学习sklearn中的train_test_split()函数
admin
2023-07-18 15:22:45
0

使用train_test_split函数可以将原始数据集按照一定比例划分训练集和测试集对模型进行训练

一、举例


import numpy as np #科学计算库

from sklearn.model_selection import train_test_split #train_test_split函数

x = np.arange(15).reshape(-1, 3) #生成5行3列的一个矩阵

>>x

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14]])

y = np.arange(5) #5个数的向量

>>y

array([0, 1, 2, 3, 4])

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=1)

>>x_train

array([[ 3,  4,  5],
       [12, 13, 14],
       [ 0,  1,  2],
       [ 9, 10, 11]])

>>x_test

array([[6, 7, 8]])

>>y_train

array([1, 4, 0, 3])

>>y_test

array([2])

二 说明

x,y是原始的数据集。x_train,y_train 是原始数据集划分出来作为训练模型的,fit模型的时候用。
x_test,y_test 这部分的数据不参与模型的训练,而是用于评价训练出来的模型好坏,score评分的时候用。
test_size=0.2 测试集的划分比例
random_state=1 随机种子,如果随机种子一样,则随机生成的数据集是相同的


三 使用KNN

from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(x_train, y_train) #用fit训练模型,x_train, y_train是第一步划分的数据集。

knn_clf.score(x_test, y_test) #score测试模型,x_test, y_test是第一步划分得到的


相关内容

热门资讯

马斯克,又一次创造了历史 太震撼了!马斯克,又一次创造了历史。北京时间6月12日晚,SpaceX正式登陆纳斯达克。没有红毯,没...
上海科技影都持续发力 多项影视... 上证报中国证券网讯(记者 杨翔菲)6月13日,为期两天的2026上海科技影都创制生态大会暨AltNe...
从App到Agent:Harm... 6月12日,华为开发者大会2026(HDC 2026)盛大开幕,HarmonyOS 7面向开发者正式...
高管花式退场,阿里AI不需要“... 一场漫长且诡异的高管离职传闻,正将阿里AI业务再度推至舆论中心。 6月13日据IT之家报道,阿里合伙...
苹果提交无人机集群网络优化专利... IT之家 6 月 14 日消息,苹果公司或许已经搁置了打造苹果汽车的宏大构想,但这家总部位于库比蒂诺...
美战机在华盛顿州坠毁引发森林火... 【环球网报道】据美国福克斯新闻网、《西雅图时报》等媒体报道,一架军用飞机当地时间13日在美国华盛顿州...
蒋万安呼吁废台监察机构被批应多... 海峡导报综合报道 民进党当局公布第7届“监察委员”提名名单,台北市长蒋万安表态主张废除台监察机构,建...
富二代,捐了“半个故宫” 1941年6月的一个清晨,收藏家张伯驹走出位于上海的寓所,坐上汽车前往外滩。不久后,他就消失在人们的...
谷爱凌从斯坦福毕业了!穿学士服... 直播吧06月14日讯 今日谷爱凌在社媒发布动态,晒出了他在斯坦福毕业季拍摄的照片。谷爱凌2022年入...
英格兰队训练物资被盗疑为内鬼作... 正在备战世界杯的英格兰队遭遇失窃事件,引发关注。消息人士证实,此前运送装备至堪萨斯城斯沃普足球村基地...