Maxay tahay k-micnaheedu?

Macluumaadka macdanta leh ee k-yaas micnaheedu waa algorithm

K- waxaa loola jeedaa algorithm clustering waa xogta macdanta iyo qalabka barashada mashiinka loo isticmaalo si loo uruuriyo indho-indheynta kooxaha kooxaha indha-indheynta la xidhiidha iyadoon aqoon hore u lahayn cilaaqaadkaas. Marka la eego, algorithm wuxuu isku dayayaa inuu muujiyo nooca, ama koox, xogta ay ka tirsan tahay, tirada tirada ee lagu qeexay qiimaha k.

K- Taas macnaheedu waa algorithm waa mid ka mid ah farsamooyinka qaabka ugu fudud ee loo isticmaalo, waxaana caadi ahaan loo adeegsadaa sawirada caafimaadka, biometrics, iyo meelaha la xiriira. Faa'iidada k- waxaa loola jeedaa isku dhufashada waa inuu sheego xogtaada (adigoo isticmaalaya foomka aan la ilaalin) halkii aad ku baran lahayd algorithm ku saabsan xogta bilawga (adoo isticmaalaya foomka kormeerka ee algorithm).

Waxaa mararka qaarkood loogu yeeraa Lloyd's Algorithm, gaar ahaan wareegyada sayniska kombiyuutarka sababtoo ah istaandarada istaandarka ah ayaa markii ugu horraysay soo jeedisay Stuart Lloyd 1957. Ereyga "k-micnaheedu" waxa lagu soo daray 1967-dii James McQueen.

Sida k-micnaheedu u yahay Algorithm Functions

K- waxaa loola jeedaa algorithm waa algorithi habdhismeed kaas oo magaciisa ka helaya habka uu u shaqeeyo. Qaababka algorithm ee kormeerayaasha ee kooxaha k , halkaasoo k waxaa loo bixiyaa sidii loo yaqaan 'parameter input'. Ka dibna waxa uu ku meeleeyaa kormeer kasta oo ku saabsan xayeysiisyada oo ku salaysan dhawaanshaha kormeerka ee celceliska kooxda. Celceliska kooxaha ayaa markaa dib loo eegayaa, geeddi-socodkuna wuxuu mar kale bilaabmaa. Waa kuwan sida qaabka algorithm u shaqeeyo:

  1. Algorithm si aan macquul ahayn ayuu u doortaa dhibcaha k oo ah xarumaha xarumaha kowaad (sida).
  2. Meel kasta oo ka mid ah warbixinta dataset ayaa loo xilsaaray xiraha xiran, oo ku salaysan masaafada Euclidiinta ee u dhaxeysa dhibic kasta iyo xarun kasta oo kooxeed.
  3. Xarun kasta oo kooxeed ayaa lagu celiyaa sida celceliska dhibcaha ee kooxdu.
  4. Talaabooyinka 2 iyo 3 ku celceli ilaa xiniinyaha ay isugu yimaadaan. Isku-dhafka waxaa loo qeexi karaa si kala duwan iyadoo ku xiran hirgelinta, laakiin sida caadiga ah macnaheedu waa in aan la fiirin kormeerayaasha isbeddelka marka tallaabooyinka 2 iyo 3 lagu soo celiyo, ama isbeddeladu aysan wax farqi ah u sameynin qeexidda kooxaha.

Doorashada Tirada Kooxaha

Mid ka mid ah faa'iidooyinka ugu muhiimsan ee k- waxaa loola jeedaa isku dhafashada waa xaqiiqda ah inaad waa inaad sheegto tirada kooxood ee loo yaqaan 'input for the algorithm'. Sida loo naqshadeeyey, algorithmku ma awoodo inuu go'aamiyo tirada tirada ku haboon ee ku xiran isticmaalaha wuxuuna ku xiran yahay isticmaalaha si hore loogu aqoonsado.

Tusaale ahaan, haddii aad haysatid koox dad ah oo loogu talagalay in lagu dhejiyo aqoonsi lab iyo dhedig ahaan lab ah ama lab / dhedig, wac k- macnaheedu waa algorithm iyadoo la adeegsanayo fekerka k = 3 wuxuu dadka ku qasbi karaa saddex qaybood marka laba kaliya, ama talada k = 2, waxay bixin doontaa tayad dabiici ah oo dheeraad ah.

Sidoo kale, haddii koox ka mid ah shakhsiyaadka si fudud loogu dhejiyay iyada oo lagu saleynayo gobolka guriga oo aad ku magacawday k- macnaheedu waa algorithm oo leh fikradda k = 20, natiijooyinka waxaa laga yaabaa inay noqoto mid guud oo waxtar leh.

Sababtan awgeed, badanaa waa fikrad wanaagsan in la tijaabiyo qiimaha kala duwan ee k si loo ogaado qiimaha ugu habboon ee ku habboon xogtaada. Waxa kale oo aad jeclaan lahayd inaad sahamiso isticmaalka macluumaadka kale ee macdanta algorithms ee aad raadineysid aqoonta mashiinka-aqoonta.