找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

機器學習資料整理【內有福利】 加入本站QQ交流群 本站落實實名發帖政策的通知
從20世紀60年代,由MIT的計算機教授組織了第一個面向本科生的Summer Project,經歷了20世紀50年代初到90年代,嘗試用創建?/div>
全球人工智能技術和計算機視覺技術領跑者,肇觀電子(NextVPU),日前正式發布世界?/div>
自語音識別技術進入深度學習時代,語音識別
數據堂自有版權的中國兒童手機采集語音數據產品共計3000小時。發音人均為6~12
TensorFlow官方文檔—中文版 鏈接:https://pan.ba
該教程將通過知識點講解+答疑指導相結合的方式,讓大家循序漸進的了解深度學習模型并通過實操演示掌握相關框架及TensorFlow工?/div>
本帖最后由 周天 于 2018-1-2
最最經典的凸
機器學習算法需要作用于數據,而數據的本質則決定了應
總體而言,這本書從基礎到研究前沿介紹了深度學習的核心概念與理論。我們不僅能了解到全連接、卷積和循環等基本深度神經網絡網絡,同時還
【主講嘉賓】 https://bbs.byr.cn/att/BBSOpenAPI/0/1560/41488 宋 宇 縱目科技無人駕駛事業部首席科學?/div>
1011
換個方式哈哈哈感覺到回個結核桿菌回個就
“N+”大會是面向全球 AR、VR、AI 等互聯網新技術領域的行業領袖及從業者的盛會。 旨在推動全球
  維塔利克˙布特林(Vitalik Buterin)將蒞臨“2018區塊鏈技術于場景落地峰會”做報告 764   布特林,一個誓言用區塊鏈顛覆真實經濟體系的俄羅斯小子,他打造的全新
優達學院面試技能三件套,包括找工作策略、模擬面試、拓展人脈三門課程
編者按:2017年是不平凡的一年(當然,事實上,每一年都是;P)?/div>
查看: 1813|回復: 10
打印 上一主題 下一主題

最流行的4個機器學習數據集

[復制鏈接]

164

主題

306

帖子

1萬

積分

管理員

積分
15778
跳轉到指定樓層
樓主
發表于 2018-1-12 11:23:46 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
機器學習算法需要作用于數據,而數據的本質則決定了應用的機器學習算法是否合適,而數據的質量也會決定算法表現的好壞程度。所以會研究數據,會分析數據很重要。本文作為學習研究數據系列博文的開篇,列舉了4個最流行的機器學習數據集。
IrisIris也稱鳶尾花卉數據集,是一類多重變量分析的數據集。通過花萼長度,花萼寬度,花瓣長度,花瓣寬度4個屬性預測鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個種類中的哪一類。
[td]
數據集特征:多變量記錄數:150領域:生活
屬性特征:實數屬性數目:4捐贈日期1988-07-01
相關應用:分類缺失值?網站點擊數:563347
Adult該數據從美國1994年人口普查數據庫抽取而來,可以用來預測居民收入是否超過50K$/year。該數據集類變量為年收入是否超過50k$,屬性變量包含年齡,工種,學歷,職業,人種等重要信息,值得一提的是,14個屬性變量中有7個類別型變量。
[td]
數據集特征:多變量記錄數:48842領域:社會
屬性特征:類別型,整數屬性數目:14捐贈日期1996-05-01
相關應用:分類缺失值?網站點擊數:393977
Wine這份數據集包含來自3種不同起源的葡萄酒的共178條記錄。13個屬性是葡萄酒的13種化學成分。通過化學分析可以來推斷葡萄酒的起源。值得一提的是所有屬性變量都是連續變量。
[td]
數據集特征:多變量記錄數:178領域:物理
屬性特征:整數,實數屬性數目:13捐贈日期1991-07-01
相關應用:分類缺失值?網站點擊數:337319
Car Evaluation這是一個關于汽車測評的數據集,類別變量為汽車的測評,(unacc,ACC,good,vgood)分別代表(不可接受,可接受,好,非常好),而6個屬性變量分別為「買入價」,「維護費」,「車門數」,「可容納人數」,「后備箱大小」,「安全性」。值得一提的是6個屬性變量全部是有序類別變量,比如「可容納人數」值可為「2,4,more」,「安全性」值可為「low, med, high」。
[td]
數據集特征:多變量記錄數:1728領域:N/A
屬性特征:類別型屬性數目:6捐贈日期1997-06-01
相關應用:分類缺失值?網站點擊數:272901
小結
通過比較以上4個數據集的差異,簡單地總結:當需要試驗較大量的數據時,我們可以想到「Adult」;當想研究變量之間的相關性時,我們可以選擇變量值只為整數或實數的「Iris」和「Wine」;當想研究logistic回歸時,我們可以選擇類變量值只有兩種的「Adult」;當想研究類別變量轉換時,我們可以選擇屬性變量為有序類別的「Car Evaluation」。更多的嘗試還需要對這些數據集了解更多才行。
以上數據集下載地址http://archive.ics.uci.edu/ml/


作者:紫松
鏈接:https://www.jianshu.com/p/be23b3870d2e
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

回復 論壇版權

使用道具 舉報

0

主題

34

帖子

101

積分

普通會員

積分
101
沙發
發表于 2018-1-16 18:06:41 | 只看該作者
回復

使用道具 舉報

0

主題

40

帖子

145

積分

普通會員

積分
145
板凳
發表于 2018-1-23 22:23:26 | 只看該作者
謝謝
回復

使用道具 舉報

0

主題

43

帖子

6388

積分

金牌會員

積分
6388
地板
發表于 2018-2-18 00:18:56 | 只看該作者
謝謝分享!
回復

使用道具 舉報

0

主題

10

帖子

-37

積分

限制會員

積分
-37
5#
發表于 2018-6-22 20:32:58 | 只看該作者
感謝
回復

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規則

宸ュ晢钀ヤ笟鎵х収鐢靛瓙璁稿彲璇? />
                             </a>
                             <span class=| QQ|申請友鏈|小黑屋|手机版|人工智能A7論壇(aqinet.cn) ( 滬ICP備15039134號-1 ) 人工智能A7論壇壇友會

GMT+8, 2019-7-7 14:07 , Processed in 0.061117 second(s), 49 queries .

Powered by Discuz! X3.4 Licensed

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表
四圣兽救援彩金