Білімі:Орта білім беру және мектептер

Ең жақын көршілес әдіс: жұмыс үлгісі

Ең жақын көршісінің әдісі әртүрлі объектілердің ұқсастығын бағалауға негізделген қарапайым метрикалық классификатор болып табылады.

Талданатын нысан оқыту үлгісінің субъектілері жататын сыныпқа жатады. Ең жақын көршіміздің әдісі қандай екенін білейік. Бұл күрделі мәселені түсінуге тырысайық, әр түрлі әдістердің мысалдарын келтірейік.

Әдістің гипотезасы

Ең жақын көршілес әдіс жіктеу үшін қолданылатын ең көп таралған алгоритм деп санауға болады. Жіктеуден өтетін объект x_i оқыту үлгісінің ең жақын нысаны тиесілі y_i класына жатады.

Жақын көршілердің әдіснамасының ерекшелігі

Жақын көршілердің әдісі k классификацияның сенімділігін арттыруға мүмкіндік береді. Талданатын объекті көршілердің негізгі массасы сияқты, яғни, x_i талдау үлгісіне жақын объектілерге ұқсас сыныпқа жатады. Екі сыныпқа байланысты мәселелерді шешкен кезде, көршілердің саны әртүрлі сыныптарға тиесілі болса, көршілер саны бірдей болмайды.

Салмақты көршілердің әдістемесі

Жақын маңдағы көршілердің посредкли әдісі сабақтар саны кем дегенде үш болған кезде пайдаланылады, ал тақшылығын қолдануға болмайды. Бірақ мұндай жағдайларда тіпті белгісіздік туындайды. Сонда i-ші көрші w_i салмағын алады, ол көрші i дәрежесімен төмендейді. Нысан жақын көршілер арасында максималды салмақты алатын сыныпқа қатысты.

Компактность гипотезасы

Жоғарыда аталған барлық әдістердің негізі - ықшамдаудың гипотезасы. Ол объектілердің ұқсастығы өлшемі мен олардың бір сыныпқа тиесілі арасындағы байланыстың болуын талап етеді. Бұл жағдайда әр түрлі көзқарастардың шекарасы қарапайым нысаны бар және сыныптар объектілер кеңістігінде ықшам ұялы аумақтарды жасайды. Математикалық талдаудағы осындай домендерде жабық шектеулі жиынтықтар деген сөз әдеттегі болып табылады. Бұл гипотеза бұл сөздің күнделікті қабылдауымен байланысты емес.

Негізгі формула

Ең жақын көршіміздің әдісін егжей-тегжейлі қарастырайық. Егер «нысанға жауап беру» пішінінің оқу үлгісі X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \} ұсынылса; Егер объектілер жиынтығы үшін \ rho (x, x ') функциясы объектілердің ұқсастығының жеткілікті үлгісі ретінде ұсынылса, бұл функцияның мәні артып, объектілердің арасындағы ұқсастық x, x' азаяды.

Кез-келген нысан үшін, x_i үлгісіндегі оқыту үлгісін объектілердің көбейтетін қашықтығы ретінде орнатамыз:

\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}

Мұнда x_ {i; U} бастапқы нысанның i-ші көршісі болып табылатын оқу үлгісі нысанын сипаттайды. Бұл ескертуді i-ші көршісіне жауап ретінде пайдаланамыз: y_ {i; U}. Нәтижесінде біз еркін нысандағы өз үлгісінің нөмірленуінің өзгеруіне әкеп соқтырамыз.

Көршілердің санын анықтау k

Ең жақын көршісінің әдісі k = 1-де тек қана шығарынды объектілерінде ғана емес, сонымен қатар жақын орналасқан басқа кластарға да қате жіктеледі.

Егер k = m алсақ, алгоритм максималды тұрақты болады және тұрақты мәнге айналады. Сондықтан сенімділік үшін экстремалды көрсеткіштерге жол бермеу маңызды.

Іс жүзінде сырғымалы бақылау критерийі оңтайлы көрсеткіш ретінде пайдаланылады.

Шығарындыларды жою

Оқыту пәндері негізінен тең емес, бірақ олардың арасында сыныптың тән ерекшеліктері бар және стандарттар деп аталатындар бар. Тақырыптың идеалды үлгісіне жақын болғандықтан, оның белгілі бір сыныпқа тиесілі болуы ықтималдығы жоғары.

Жақын көршілердің әдісі қаншалықты тиімді? Мысал объектілердің перифериялық және бейсызық санаттарына негізделген. Қарастырылып жатқан объектінің тығыз ортасы осы сыныптың басқа өкілдері ретінде қабылданады. Егер сіз оларды үлгіден алып тастасаңыз, сыныптаудың сапасына әсер етпейді.

Осындай үлгіге кіру үшін басқа класстағы «қалыңдаған» шу шығарындыларының белгілі бір саны болуы мүмкін. Жою, негізінен, жіктелу сапасына оң әсер етеді.

Егер ақпараттық емес және шуыл объектілері үлгіден жойылса, онда бір уақытта бірнеше оң нәтиже күтіледі.

Ең алдымен , жақын көршісінің әдісімен интерполяция жіктеу сапасын жақсартуға, сақталған деректердің көлемін азайтуға, жіктеу уақытын қысқартуға мүмкіндік береді, ол ең жақын стандарттарды таңдауға жұмсалады.

Үлкен емес үлгілерді қолдану

Ең жақын көршілес әдіс оқыту объектілерін нақты сақтауға негізделген. Үлкен ірі үлгілерді жасау үшін техникалық проблемаларды қолданады. Міндет - ақпараттың едәуір мөлшерін сақтау ғана емес, сонымен қатар ең жақын көршілер арасында еркін нысанды табу үшін ең аз уақыт кезеңінде.

Тапсырманы орындау үшін екі әдіс пайдаланылады:

  • Ақпараттық емес объектілерді тастап, үлгіні жұқа етіп тастаңыз;
  • Ең жақын көршілерді дереу іздестіру үшін арнайы тиімді құрылымдар мен деректер индекстерін қолданыңыз.

Әдістерді таңдау ережелері

Жіктеу жоғарыда қаралды. Ең жақын көршісінің әдісі практикалық міндеттерді шешу үшін қолданылады, онда қашықтықтың функциясы \ rho (x, x ') алдын ала белгілі. Нысандарды сипаттағанда, сандық векторлар евклидтік метриканы пайдаланады. Мұндай таңдаудың ерекше негіздемесі жоқ, бірақ ол «бір шкала бойынша барлық белгілерді өлшеуді» білдіреді. Егер бұл фактор есепке алынбайтын болса, онда метрика үлкен сандық мәндері бар белгіден басым болады.

Белгілі бір сипаттамалар үшін ауытқулар сомасы ретінде ара қашықтықты есептеу кезінде көптеген ерекшеліктер болған кезде маңызды өлшемділік мәселесі пайда болады.

Жоғары өлшемді кеңістікте барлық нысандар бір-бірінен алыс болады. Соңғы талдауда, зерттеуге арналған объектіге жақын көршілердің еркін үлгісі ерікті болады. Бұл проблеманы жою үшін ақпараттық таңбалардың аз саны таңдалады. Есептеулерді есептеу алгоритмдері әртүрлі сипаттамалар жиынтығы негізінде құрастырылған және әрбір жеке адам үшін олардың жақындық функциясын құрастырады.

Қорытынды

Математикалық есептеулер көбінесе өз ерекшеліктері, артықшылықтары мен кемшіліктері бар әртүрлі техниканы қолдануды қамтиды. Жақын көршілердің қарастырылған әдістемесі математикалық объектілерді сипаттауға байланысты өте күрделі мәселелерді шешуге мүмкіндік береді. Зерттелетін техникаға негізделген тәжірибелік концепциялар жасанды интеллект құралдарында белсенді қолданылады.

Сараптамалық жүйелерде объектілерді жіктеу ғана емес, сонымен қатар пайдаланушыға осы классификацияның түсіндірмесін көрсету қажет. Бұл әдіс бойынша мұндай құбылыстың түсіндірілуі объектінің белгілі бір сыныпқа қатынасында және пайдаланылатын үлгіге қатысты орналасуымен анықталады. Құқық индустриясының мамандары, геологтар, дәрігерлер бұл «прецедент» логиканы қабылдайды, оны оқуға белсенді пайдаланады.

Талдауға болатын әдіс барынша сенімді болу үшін тиімді, қажетті нәтиже беріңіз, ең төменгі индикатор k қабылдануы керек, сондай-ақ талданатын объектілердің шығарындыларына жол бермеу керек. Сондықтан да стандарттарды таңдау әдістемесі қолданылады және метрикалық оңтайландыру да жүзеге асырылады.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 kk.atomiyme.com. Theme powered by WordPress.