Tekoälystä on tullut keskeinen väline mielenterveysongelmien, kuten masennuksen, havaitsemiseksi sosiaalisen median kanavien kautta. Kattava katsaus, jonka tekivät hiljattain Northeasternin yliopistosta valmistuneet Yuchen Cao ja Xiaorui Shen, tuo kuitenkin esiin merkittäviä ennakkoluuloja ja metodologisia ongelmia näissä tekoälymalleissa. Heidän näkemyksensä keskittyvät paljastamaan näiden työkalujen riippuvuuden epätäydellisestä aineistosta ja menetelmistä, kyseenalaistaen niiden luotettavuuden tosielämässä.
Tutkimuksen tausta
Yuchen Cao ja Xiaorui Shen aloittivat tutkimusmatkan Nykyisen yliopiston Seattlen kampuksella. Kaksikko halusi tarkastella tarkkaan, kuinka koneoppimista ja syväoppimismalleja hyödynnetään mielenterveystutkimuksissa ja työnsä tuloksena he tekivät yhteistyötä muiden yliopistojen opiskelijoiden kanssa kriittisesti arvioidakseen olemassa olevaa akateemista kirjallisuutta. Tämä yhteinen työ johti 47 paperin systemaattiseen katsaukseen, jotka keskittyivät siihen, kuinka tekoälyä käytetään masennuksen havaitsemiseen käyttäjiltä eri sosiaalisen median alustoilla. Tämä kattava työ on löytänyt paikkansa Journal of Behavioral Data Science -lehdessä.
Metodologiset kömmähdykset
Analyysi toi esiin useita puutteita tarkastelluissa tekoälymalleissa. Merkittävä havainto osoitti, että vain 28 % tutkimuksista teki asianmukaisia hyperparametrien säätöjä, mikä heikentää näiden työkalujen suorituskykyä. Lisäksi noin 17 % tutkimuksista käytti virheellisiä datanjakokäytäntöjä, mikä aiheuttaa lisäriskin ylisovitukselle, jossa malli oppii kohinaa kuvioiden sijaan, mikä johtaa epäluotettaviin ennusteisiin.
Eriarvoisuus datassa ja sen seuraukset
Sosiaalisen median alustat, kuten Twitter, Reddit ja Facebook, tarjoavat runsaasti käyttäjien tuottamaa sisältöä, joka soveltuu tämän tyyppiseen analyysiin. Kuitenkin tutkimukset perustuivat vahvasti rajoitettuun demografiseen ryhmään – pääasiassa englanninkielisiin käyttäjiin Yhdysvalloissa ja Euroopassa. Länsimaisten käyttäjien yliedustus herättää kysymyksiä näiden tutkimustulosten edustavuudesta maailmanlaajuisesti. Alustojen käyttö oli epätasapainoista, sillä X (entinen Twitter) oli yleisimmin käytetty, heijastuen kahdeksassa tutkimuksessa, jotka yhdistivät useita alustoja.
Kielen hienojakoisuuden haasteet
Ihmisen puheen kielellisten vivahteiden käsittely on edelleen yksi suurimmista haasteista. Tutkimuksissa jäi usein käsittelemättä riittävästi vivahteita, kuten kieltämiset ja sarkasmi – elementit, jotka ovat kriittisiä masennuksen merkkien havaitsemisessa. Vain 23 % tarkastelluista tutkimuksista toi esille, kuinka he käsittelivät näitä kielellisiä haasteita, mikä korostaa menetelmien aukkoja.
Kehittämisen tie
Kuten valmistuneet korostavat, tietojenkäsittelytieteilijöiden tuntemien tiettyjen perusperiaatteiden noudattamatta jättäminen johtaa usein epätarkkuuksiin. Heidän kriittinen katsauksensa käytti PROBAST-työkalua, joka on suunniteltu arvioimaan ennustemallin läpinäkyvyyttä ja toistettavuutta. Odotetusti monet tutkimukset osoittautuivat puutteellisiksi tarjoamaan keskeisiä tietoja, mikä vaikeutti niiden arviointia ja toistoa. Tutkijat suosittelevat yhteistyön vaalimista, ehdottaen opetusresurssien, kuten wikien tai tutoriaalien, kehittämistä asiantuntemuksen tehokkaaksi levittämiseksi tarkempien tekoälytyökalujen saavuttamiseksi.
Nämä havainnot ovat kehotus tieteelliselle yhteisölle arvioida uudelleen ja tarkentaa mielenterveyssovelluksissa käytettyjä tekoälymalleja. Monipuolisempi datakokonaisuus, paremmin viritetyt mallit ja selkeät menetelmät luovat perustan tekoälytyökaluille, jotka palvelevat aidosti maailmanlaajuista yleisöä. Kuten todettu Northeastern Global Newsissä, he pyrkivät jakamaan löydöksensä ja kannustamaan siirtymään kohti tarkempaa tekoälymallien rakentamista tulevassa kansainvälisessä data- ja analytiikkaseurassa Washington D.C.:ssä.