Qeybinta Maaraynta Macluumaadka

Kala soociddu waa farsamaynta macdanta xogta ee udub dhexaad u ah xog ururinta si loo caawiyo saadaalinta iyo saadaalinta saxda ah. Waxa kale oo loo yaqaan mararka loo yaqaan "Tree Decision" , kala soociddu waa mid ka mid ah habab dhowr ah oo loogu talagalay in lagu sameeyo falanqaynta xogta aad u ballaaran ee waxtarka leh.

Waa maxay sababta loo kala soocayo?

Diiwaanada aad u ballaaran waxay noqonayaan caadada maanta dunida ee "xogta weyn." Bal qiyaas daraasad la socota terabyte badan oo xog ah -a terabyte waa hal trillion bytes xogta.

Facebook ayaa kaligiis garaacaya 600 terabyte oo ah xog cusub oo cusub maalin kasta (sida 2014, markii ugu dambeysay ee ay soo sheegtey sifooyinkaas). Caqabada koowaad ee xogta weyn waa sida loo sameeyo macne ahaan.

Miisaanka qulqulka ma aha dhibaatada kaliya: xogta weyni waxay sidoo kale u egtahay inay tahay mid kala duwan, aan habooneyn oo isbeddel ah. Tixgeli macluumaadka maqalka iyo fiidiyowga, boostada warbaahinta bulshada, xogta 3D ama xogta juqraafiyeed. Xogta noocan ah lama fududeyn karo ama loo habeeyay.

Si loo daboolo caqabadan, noocyo kala duwan oo toos ah oo loogu talagalay soo saaridda macluumaad faa'iido leh, ayaa ka mid ah qoondaynta .

Sidee bay u kala duwan yihiin

Marka khatarta ah in aad uga fogaato farsamada-ku-hadalka, aynu ka wada hadalno sida kala-saaridu u shaqeyso. Hadafku waa in la abuuro qawaaniin kala-soocid oo ka jawaabi doona su'aasha, go'aanka, ama habdhaqanka saadaalinta. Ku billow, xogo tabobar ah ayaa la soo saaray kuwaas oo ka kooban sifooyin gaar ah iyo sidoo kale natiijada suurtogalka ah.

Shaqada algorithm waa in la ogaado sida habka sifooyinka loo gaaro gabaggeeda.

Xaqiiqo : Waxaa laga yaabaa in shirkadda kaararka deynta ay isku dayayso in ay go'aamiso waxa laga filayo inay helaan helitaanka kaararka deynta.

Tani waxay noqon kartaa xogta tababarka:

Macluumaadka Tababarka
Magaca Da ' Lamaanaha Dakhli Sannadle ah Bixinta Kaarka Deynta
John Doe 25 M $ 39,500 Maya
Jane Doe 56 F $ 125,000 Haa

Saadaalinta "saadaalinta" tiirarka Da'da , Jinsiga , iyo Dakhliga Sanadlaha ah ayaa go'aamiya qiimaha "Saadaalinta Saameynta" Abaalmarinta Kaarka Deynta . Tababbarka tababarka, waxaa loo yaqaanaa sifaha saadaalinta. Algorithm ka dibna wuxuu isku dayaa in uu go'aamiyo sida qiimaha sifududaha loo saadaaliyay: cilaaqaadyadu maxay u kala dhexeeyaan saadaasha iyo go'aanka? Waxay kobcin doontaa shuruucda saadaasha, sida caadiga ah qoraal /

HADDII (Da '> 18 ama Da' <75) IYO Dakhliga Sanadlaha> 40,000 Deyn Kaarka Deynta Ah = haa

Sida iska cad, tani waa tusaale sahlan, algorithm wuxuu u baahan yahay xog ururin ka weyn oo ka badan labada diiwaan ee halkan lagu muujiyey. Waxaa intaa dheer, shuruudaha saadaashu waxay u badan tahay inay noqdaan kuwo aad u adag, oo ay ku jiraan shuruucda hoose si loo faahfaahiyo tafaasiilaha.

Marka xigta, algorithm waxaa la siiyaa "saadaalinta saadaasha" ee xogta si loo falanqeeyo, laakiin arrintani waxay ka maqan tahay astaamaha saadaasha (ama go'aanka):

Macluumaadka Predictor
Magaca Da ' Lamaanaha Dakhli Sannadle ah Bixinta Kaarka Deynta
Jack Frost 42 M $ 88,000
Mary Murray 16 F $ 0

Xogtan saadaashaas ayaa ka caawisa qiyaasidda saxda ah ee qiyaasaha saadaasha, iyo xeerarka ayaa markaa dib loo dhigayaa ilaa hindise-bixiyuhu u arko saadaalinta waxtar leh oo faa'iido leh.

Maalinta Maalinta Maalinta ee Qeybinta

Qeybinta, iyo farsamooyinka kale ee dhirta macdanta, waxay ka danbeysaa inta badan khibradaheena maalmeed ee macaamiisha.

Saadaalinta hawada ayaa laga yaabaa inay isticmaasho qoondaynta si ay u soo sheegto in maalintaas ay noqon doonto roobab, qorrax ama daruuro. Xirfadlaha caafimaadka ayaa falanqayn doona xaaladaha caafimaad si loo saadaaliyo natiijooyinka caafimaadka. Nooca habka kala soocida, Naive Bayesian, wuxuu isticmaalaa itimaalka shuruudda ah inuu ku magacaabo emaillada spam. Laga soo bilaabo ogaanshaha khiyaamo si loo soo bandhigo wax soo saarka, kala saariddu waxay ka dambaysaa marxaladaha maalin kasta oo falanqeeya xogta iyo soo saarista saadaasha.