Lokacin Da Sakamakon Eh Ne Ko A'a
Regression na layi yana aiki da kyau lokacin da kake hasashen lamba mai ci gaba, kamar farashin gida, zafin jiki, ko makin jarrabawa. Amma me zai faru lokacin da abin da kake son hasashe yana da sakamako biyu kaɗai? Shin abokin ciniki zai saya ko ba zai saya ba? Shin mara lafiya zai warke ko ba zai warke ba? Shin imel ɗin spam ne ko ba spam ba ne? Ga waɗannan sakamako na nau'i biyu, regression na layi ya kasa, kuma regression na logistic ya shigo.
Babbar matsalar amfani da regression na layi don sakamako na nau'i biyu ita ce yana iya samar da hasashe ƙasa da 0 ko sama da 1, waɗanda ba su da ma'ana a matsayin yiwuwar. Idan ka yi ƙoƙarin zana layi madaidaici ta cikin bayanai inda sakamakon ko 0 ne ko 1, layin ba makawa zai miƙe zuwa yankin da ba zai yiwu ba. Regression na logistic yana magance wannan ta hanyar amfani da sifa dabam gaba ɗaya.
Sigar Sigmoid
Maimakon daidaita layi madaidaici, regression na logistic yana daidaita sigar S da ake kira sigmoid (ko logistic). Wannan sigar tana farawa kusa da 0 a hagu, tana hawa ta 0.5 a tsakiya, tana kuma kusantar 1 a dama, amma ba ta taɓa isa 0 ko 1 ba da gaske. Wannan yana nufin ƙimomin da aka hasashe koyaushe yiwuwar ce mai inganci, tsakanin 0 da 1.
A zanen warwatsewa na sama, ka yi tunanin gatarin x yana wakiltar shekarun gogewa kuma gatarin y yana wakiltar ko wani ya ci jarrabawar takaddama (1 = ci, 0 = faɗi). Bayanan danye suna nuna tsari a sarari: ƙarin gogewa yana sa ci ya fi yiwuwa. Tsarin regression na logistic zai daidaita sigar sigmoid ta cikin waɗannan ɗigo, yana ba ka ƙididdigen yiwuwar ci a kowane matakin gogewa.
A lissafi, tsarin yana ɗaukar haɗuwar masu canzawa na shigarwa (kamar regression na yau da kullum) amma sai ya naɗe shi cikin aikin sigmoid. Wannan yana nufin kana samun dukkan sanannun ra'ayoyin ma'aunai da masu hasashe amma tare da fitarwa da ke yin hali a matsayin yiwuwar.
Fahimtar Rabo da Raben Yiwuwar
Regression na logistic ba ya hasashen yiwuwar kai tsaye a cikin lissafinsa na ciki. Maimakon haka, yana aiki da rabo. Idan yiwuwar wani abu ita ce 0.8, rabon shine 0.8 / 0.2 = 4, ma'ana abin ya fi yiwuwa ya faru sau huɗu fiye da ba ya faru. Tsarin a zahiri yana hasashen log na rabo (wanda ake kira log-rabo ko logit), shi ya sa wani lokaci ake kiransa regression na logit.
Ma'aunai a cikin regression na logistic ana bayyana su a matsayin log-rabo, waɗanda ba a saba fahimtarsu cikin sauƙi ba. Don sa su zama masu fahimta, masu bincike suna canza su zuwa raben yiwuwar ta hanyar ɗagawa e zuwa ƙarfin ma'aunin. Raben yiwuwar na 2.5 don mai canzawa yana nufin cewa ƙaruwar raka'a ɗaya a cikin wannan mai canzawa yana ninka rabon sakamakon da 2.5. Raben yiwuwar na 1 yana nufin babu tasiri, fiye da 1 yana nufin rabo mafi girma, kuma ƙasa da 1 yana nufin rabo mafi ƙaranci.
Asibiti ya gina tsarin regression na logistic don hasashen ko za a sake shigar da mara lafiya cikin kwanaki 30. Tsarin ya gano cewa kowace ƙarin cuta mai jure da mara lafiya ke da ita tana ƙara rabon sake shigar da sau 1.4 (raben yiwuwar = 1.4). Mara lafiya mai cututtuka 3 masu jure yana da kusan 1.4 darab 1.4 darab 1.4 = 2.74 na rabon sake shigar idan aka kwatanta da mara lafiya marar cututtuka masu jure. Wannan yana ba likitoci dalili mai ƙididdiga kuma a sarari na haɗari.
Lokacin Da Za A Zaɓi Logistic A Kan Regression Na Layi
Shawarar tana da sauƙi: idan sakamakon ka na nau'i biyu ne (nau'i biyu), yi amfani da regression na logistic. Idan sakamakon ka mai ci gaba ne, yi amfani da regression na layi. Ƙoƙarin tilasta sakamako na nau'i biyu cikin tsarin layi zai ba ka sakamako masu ɓatarwa, hasashe marasa ma'ana, da keta sharuɗɗa.
Akwai ƙarin cigaban regression na logistic don sakamako da ke da nau'uka fiye da biyu. Regression na logistic na multinomial yana magance yanayi inda sakamakon ɗaya ne daga cikin nau'uka uku ko fiye marasa tsari (kamar zaɓar tsakanin bas, mota, ko keke). Regression na logistic na ordinal yana magance nau'uka masu tsari (kamar kimanta wani abu a matsayin ƙasa, matsakaici, ko sama). Amma sigar nau'i biyu na yau da kullum ita ce mafi yawan amfani.
Zanen warwatsewa na biyu na sama na iya wakiltar shekaru (gatarin x) da ko mutum yana da wata matsalar lafiya (gatarin y). Ka lura yadda layi madaidaici zai yi mummunan daidai, amma sigar S za ta kama sauyin daga ƙarancin yiwuwa a ƙananan shekaru zuwa babbar yiwuwa a manyan shekaru.
Fassara da Kimanta Tsarin
Ba kamar regression na layi ba, regression na logistic ba ya amfani da R-murabba'i don auna daidaituwa. Maimakon haka, kana kimanta shi ta yadda yake rarraba shari'u da kyau. Ma'aunai na gama gari sun haɗa da daidaito (wane kashi na hasashe ya yi daidai), ƙarfin gano (adadin abin da ya faru na gaske da ya gano), takamaiman (adadin abin da ba ya faruwa na gaske da ya gano daidai), da yankin ƙarƙashin sigar ROC (AUC), wanda ke taƙaita iyawar rarrabuwa gabaɗaya a ma'auni daga 0.5 (hasashe bazuwar) zuwa 1.0 (cikakke).
Kana kuma buƙatar zaɓar iyakar rarrabuwa. Tsarin yana ba da yiwuwar, amma don yanke shawarar eh/a'a, kana buƙatar zaɓar aya. Yawanci ana amfani da 0.5: idan hasashen yiwuwar ya fi 0.5, ka hasashe "eh." Amma a wasu yanayi, za ka iya rage iyakar. Gwajin tantancen likita na iya amfani da 0.3 don kama ƙarin abubuwan da suka faru na gaske, yana karɓar ƙarin ƙararraki na ƙarya a matsayin musaya.
Regression na logistic yana ɗauka cewa akwai dangantakar layi tsakanin masu canzawar shigarwa da log-rabo na sakamakon. Yana kuma ɗauka cewa abubuwan lura suna da 'yancin kai daga juna. Yana da sauƙi idan aka kwatanta da hanyoyin koyon mashin na ci gaba, wanda a zahiri ƙarfi ne: sakamakon ana iya fassara su, raben yiwuwar suna da ma'ana, kuma tsarin yana da sauƙin bayyanawa ga masu saurare marasa fasaha.
Regression Na Logistic A Duniyar Gaske
Regression na logistic yana ko'ina. Bankuna suna amfani da shi don yanke shawarar ko za a amince da lamuni (kasa biya ko rashin kasa biya). Masu ba da imel suna amfani da shi don rarraba spam. Masu talla suna amfani da shi don hasashen wane abokan ciniki za su bar su. Masu binciken likita suna amfani da shi don gano dalilan haɗarin cuta. Shahararsa ta fito daga haɗin sauƙi, iya fassara, da kyakkyawan aiki a kan matsalolin duniyar gaske da yawa.
Lokacin da kake karanta bincike da ke ba da rahoton raben yiwuwar, kana kallon fitarwar regression na logistic. Fahimtar abin da waɗannan lambobin ke nufi -- cewa raben yiwuwar na 1.8 yana nufin kashi 80% mafi girman rabo, ba kashi 80% mafi girman yiwuwa ba -- yana da muhimmanci don fassara binciken likita da na kimiyyar zamantakewa daidai.
Regression na logistic shine hanyar yau da kullum don hasashen sakamako na nau'i biyu. Yana amfani da aikin sigmoid don riƙe hasashe tsakanin 0 da 1, kuma ana fassara ma'aunansa a matsayin raben yiwuwar. Yi amfani da shi duk lokacin da sakamakonka eh/a'a ne, ci/faɗi, ko kowane mai canzawa na nau'i biyu. Yayin da lissafin ya ƙunshi log-rabo, fassarar zahiri tana da tsafta: kowane mai hasashe ko yana ƙara ko yana rage rabon sakamakon da adadi da za a iya ƙididdige.