page_banner

жаңылыктар

Large Language Model (LLM) тез сөздөргө негизделген ынандырарлык макалаларды жаза алат, кесипкөйлүк экзамендерин тапшырат жана сабырдуу жана боорукер маалымат жаза алат. Бирок, LLMдеги фантастика, морттук жана так эмес фактылардын белгилүү тобокелдиктеринен тышкары, башка чечилбеген маселелер бара-бара көңүл чордонуна айланууда, мисалы, аларды түзүүдө жана колдонууда дискриминациялоочу “адамдык баалуулуктарды” камтыган AI моделдери жана LLM мындан ары мазмунду ойлоп чыгарбай, зыяндуу натыйжаларды жок кылса дагы, “LLM баалуулуктары” адамдык баалуулуктарды бузушу мүмкүн.

 

Сансыз мисалдар AI моделдерин окутуу үчүн колдонулган маалыматтар моделдин ичинде бекемделиши мүмкүн болгон жеке жана коомдук баалуулуктарды кантип коддоорун көрсөтүп турат. Бул мисалдар бир катар колдонмолорду камтыйт, анын ичинде көкүрөк рентген нурларын автоматтык чечмелөө, тери ооруларын классификациялоо жана медициналык ресурстарды бөлүштүрүү боюнча алгоритмдик чечимдерди кабыл алуу. Биздин журналдагы акыркы макалада айтылгандай, бир жактуу окутуу маалыматтары коомдо орун алган баалуулуктарды жана бир тараптуулукту күчөтүп, ачып бериши мүмкүн. Тескерисинче, изилдөөлөр ошондой эле AI бир тараптуулукту азайтуу үчүн колдонулушу мүмкүн экенин көрсөттү. Мисалы, изилдөөчүлөр тизенин рентген тасмаларына терең үйрөнүү моделдерин колдонушту жана тизе муунунун ичиндеги стандарттык оордук көрсөткүчтөрү (радиологдор тарабынан бааланган) тарабынан байкалбай калган факторлорду табышты, ошону менен ак жана кара бейтаптардын ортосундагы түшүнүксүз оору айырмачылыктарын азайтышты.

Барган сайын көбүрөөк адамдар AI моделдериндеги бир тараптуулукту түшүнүп жатышат, айрыкча окутуу маалыматтары жагынан, AI моделдерин иштеп чыгуу жана жайылтуу процессинде адамдык баалуулуктардын башка көптөгөн кирүү пункттарына жетиштүү көңүл бурулбайт. Медициналык AI жакында эле таасирдүү натыйжаларга жетишти, бирок көп даражада ал адам баалуулуктарын жана алардын тобокелдиктерди баалоо жана ыктымалдык ой жүгүртүү менен өз ара аракеттенүүсүн ачык-айкын караган эмес, ошондой эле моделдештирилген эмес.

 

Бул абстракттуу түшүнүктөрдү конкреттештирүү үчүн, сиз өзүңүздүн жашынын 3 пайызынан төмөн болгон 8 жаштагы балага адамдын рекомбинанттык өсүү гормонун жазып бериши керек болгон эндокринолог экениңизди элестетиңиз. Баланын стимулданган өсүү гормонунун деңгээли 2 нг/млден төмөн (маалыматтык маани,>10 нг/мл, Америка Кошмо Штаттарынан тышкары көптөгөн өлкөлөр үчүн эталондук маани>7 нг/мл) жана анын адамдын өсүү гормонун коддоочу гени сейрек кездешүүчү инактивация мутацияларын аныктады. Биз адамдын өсүү гормонунун терапиясын колдонуу бул клиникалык шартта айкын жана талашсыз деп эсептейбиз.

Адамдын өсүү гормонунун терапиясын төмөнкү сценарийлерде колдонуу карама-каршылыктарды жаратышы мүмкүн: 14 жаштагы баланын бою ар дайым теңтуштарынын 10-процентилинде болгон, ал эми стимулдангандан кийин адамдын өсүү гормонунун туу чокусу 8 нг/мл. Боюна таасир эте турган функциялык мутациялар, ошондой эле боюнун кыска болушунун башка белгилүү себептери жок жана анын сөөк жашы 15 жашта (б.а. өнүгүүдө артта калуу жок). Талаш-тартыштын бир бөлүгү гана өсүү гормонунун обочолонгон жетишсиздигин диагностикалоо үчүн колдонулган адамдын өсүү гормонунун деңгээли боюнча ондогон изилдөөлөрдүн негизинде эксперттер тарабынан аныкталган босого маанилериндеги айырмачылыктарга байланыштуу. Жок дегенде көп талаш-тартыштар бейтаптардын, бейтаптардын ата-энелеринин, саламаттыкты сактоо адистеринин, фармацевтикалык компаниялардын жана төлөөчүлөрдүн көз карашы боюнча адамдын өсүү гормонунун терапиясын колдонуунун тобокелдик-пайда балансынан келип чыгат. Педиатрдык эндокринологдор 2 жыл бою өсүү гормонунун күнүмдүк инъекциясынын сейрек кездешүүчү терс таасирин таразалап, азыркыга салыштырмалуу бойго жеткен адамдын денесинин көлөмүнүн өспөй же минималдуу өсүш ыктымалдыгы бар. Балдардын бою 2 см гана өссө дагы, өсүү гормонун сайып салуу керек деп ишениши мүмкүн, бирок төлөөчү жана фармацевтикалык компания ар кандай көз карашта болушу мүмкүн.

 

Биз мисал катары креатининге негизделген eGFRди алабыз, ал өнөкөт бөйрөк ооруларын диагностикалоо жана стадиялоо, бөйрөктү трансплантациялоо же донордук шарттарды коюу, ошондой эле рецепт боюнча жазылган көптөгөн дары-дармектердин кыскартуу критерийлерин жана каршы көрсөтмөлөрүн аныктоо үчүн кеңири колдонулган бөйрөк функциясынын индикатору. EGFR – бул өлчөнгөн гломерулярдык чыпкалоо ылдамдыгын (mGFR) баалоо үчүн колдонулган жөнөкөй регрессиялык теңдеме, бул эталондук стандарт, бирок баалоо ыкмасы салыштырмалуу оор. Бул регрессия теңдемесин AI модели катары кароого болбойт, бирок ал адам баалуулуктары жана ыктымалдык ой жүгүртүү жөнүндө көптөгөн принциптерди көрсөтөт.

eGFRге кирүү үчүн адам баалуулуктары үчүн биринчи кирүү чекити теңдемелерди тууралоо үчүн маалыматтарды тандоо болуп саналат. eGFR формуласын иштеп чыгуу үчүн колдонулган баштапкы кезек негизинен ак жана кара түстөгү катышуучулардан турат жана анын башка көптөгөн этностук топторго колдонулушу так эмес. Бул формулага адам баалуулуктары үчүн кийинки кирүү пункттары төмөнкүлөрдү камтыйт: бөйрөктүн иштешин баалоо үчүн негизги максат катары mGFR тактыгын тандоо, тактыктын алгылыктуу деңгээли деген эмне, тактыкты кантип өлчөө керек жана eGFRди клиникалык чечим кабыл алуу үчүн босого катары колдонуу (мисалы, бөйрөк кабыргасын трансплантациялоо үчүн шарттарды аныктоо сыяктуу). Акырында, киргизүү моделинин мазмунун тандоодо, адамдык баалуулуктар да бул формулага кирет.

Мисалы, 2021-жылга чейин көрсөтмөлөр eGFR формуласындагы креатинин деңгээлин пациенттин жашына, жынысына жана расасына жараша тууралоону сунуштайт (кара же кара эмес адамдар катары гана классификацияланат). Расага негизделген тууралоо mGFR формуласынын тактыгын жакшыртууга багытталган, бирок 2020-жылы ири ооруканалар пациенттин трансплантацияга жарамдуулугун кечеңдетүү жана расаны биологиялык концепция катары конкреттештирүү сыяктуу себептерди жүйө келтирип, расага негизделген eGFRди колдонуудан шектене башташты. Изилдөөлөр көрсөткөндөй, eGFR моделдерин раса боюнча долбоорлоо тактыкка жана клиникалык натыйжаларга терең жана ар түрдүү таасир этиши мүмкүн; Ошондуктан, тандалма түрдө тактыкка басым жасоо же натыйжалардын бир бөлүгүнө көңүл буруу баалуулуктарды чагылдырат жана ачык-айкын чечимдерди кабыл алууну жашырышы мүмкүн. Акыр-аягы, улуттук жумушчу топ жаңы формуланы сунуштады, ал жаңы формуланы сунуштады, ал иштин натыйжалуулугун жана калыстык маселелерин тең салмактоо үчүн жарышты эске албастан кайра орнотулган. Бул мисал жөнөкөй клиникалык формуланын да адамдык баалуулуктарга кирүү чекиттери көп экенин көрсөтүп турат.

Ооруканадагы операция бөлмөсүндө виртуалдык реалдуулук менен доктор. Хирург пациенттин жүрөгүн текшерүүнүн жыйынтыгын жана адамдын анатомиясын технологиялык санариптик футуристтик виртуалдык интерфейсте, санариптик голографиялык, илимде жана медицинада инновациялык концепцияда талдап жатат.

Болжолдуу көрсөткүчтөрдүн аз сандагы клиникалык формулаларга салыштырмалуу, LLM миллиарддагандан жүздөгөн миллиарддаган параметрлерден (модель салмактары) же андан көп болушу мүмкүн, бул түшүнүүнү кыйындатат. "Түшүнүү кыйын" дегенибиздин себеби, LLMлердин көбүндө суроо берүү аркылуу жоопторду алуунун так жолун картага түшүрүү мүмкүн эмес. GPT-4 үчүн параметрлердин саны азырынча жарыялана элек; Анын мурунку GPT-3 175 миллиард параметрге ээ болгон. Көбүрөөк параметрлер сөзсүз түрдө күчтүүрөөк мүмкүнчүлүктөрдү билдирбейт, анткени көбүрөөк эсептөө циклдерин камтыган кичинекей моделдер (мисалы, LLaMA [Large Language Model Meta AI] моделдер сериясы) же адамдын пикиринин негизинде кылдат туураланган моделдер чоңураак моделдерге караганда жакшыраак иштешет. Мисалы, адам баалоочуларынын айтымында, InstrumentGPT модели (1,3 миллиард параметри бар модель) моделдин чыгаруу натыйжаларын оптималдаштырууда GPT-3тен ашып кетет.

GPT-4 боюнча конкреттүү окутуу деталдары азырынча ачыла элек, бирок GPT-3, InstrumentGPT жана башка көптөгөн ачык булактуу LLMs сыяктуу мурунку муундагы моделдердин чоо-жайы ачылды. Бүгүнкү күндө көптөгөн AI моделдери моделдик карталар менен келет; GPT-4тин баалоо жана коопсуздук маалыматтары OpenAI моделин түзүү компаниясы тарабынан берилген окшош система картасында жарыяланды. LLM түзүүнү болжол менен эки этапка бөлүүгө болот: баштапкы даярдоо баскычы жана моделдин чыгаруу натыйжаларын оптималдаштырууга багытталган тактоо этабы. Тренингге чейинки этапта модель кийинки сөздү алдын ала айтууга үйрөтүү үчүн оригиналдуу интернет текстти камтыган чоң корпус менен камсыз кылынат. Бул жөнөкөй көрүнгөн "автоматтык аяктоо" процесси күчтүү фундаменталдык моделди жаратат, бирок ал зыяндуу жүрүм-турумга да алып келиши мүмкүн. Адамдык баалуулуктар GPT-4 үчүн машыгууга чейинки дайындарды тандоо жана машыгууга чейинки маалыматтардан порнографиялык мазмун сыяктуу орунсуз мазмунду алып салуу чечими менен машыгууга чейинки баскычка кирет. Бул аракеттерге карабастан, негизги модель дагы эле пайдалуу эмес жана зыяндуу натыйжаларды камтый албайт. Кылдат тууралоонун кийинки этабында көптөгөн пайдалуу жана зыянсыз жүрүм-турумдар пайда болот.

Жакшы баптоо стадиясында тил моделдеринин жүрүм-туруму көбүнчө адамдын пикири боюнча көзөмөлдөнгөн тактоо жана бекемдөөчү үйрөнүү аркылуу терең өзгөрөт. Көзөмөлдөнгөн тактоо баскычында жалданган подрядчынын кызматкерлери ыкчам сөздөр үчүн жооп мисалдарын жазып, моделди түз үйрөтүшөт. Адамдын пикиринин негизинде окутуунун бекемдөө баскычында адам баалоочулар моделдин чыгаруу натыйжаларын киргизүү мазмунунун мисалдары катары сорттошот. Андан кийин "сыйлык моделин" үйрөнүү үчүн жогорудагы салыштыруу натыйжаларын колдонуңуз жана бекемдөөчү окутуу аркылуу моделди андан ары өркүндөтүңүз. Төмөнкү деңгээлдеги укмуштуудай адамдын катышуусу бул чоң моделдерди жакшылап тууралай алат. Мисалы, InstrumentGPT модели краудсорсинг веб-сайттарынан жалданган болжол менен 40 подрядчы персоналдын тобун колдонгон жана калктын ар кандай топторунун каалоолоруна сезимтал болгон аннотаторлор тобун тандоого багытталган скрининг сынагынан өткөн.

Бул эки экстремалдык мисал, тактап айтканда, жөнөкөй клиникалык формула [eGFR] жана күчтүү LLM [GPT-4] көрсөткөндөй, адамдын чечимдерин кабыл алуу жана адамдык баалуулуктар моделдин натыйжаларын калыптандырууда ажырагыс ролду ойнойт. Бул AI моделдери алардын ар түрдүү пациенттердин жана дарыгерлердин баалуулуктарын ала алабы? Медицинада AI колдонууну кантип ачык жолго салуу керек? Төмөндө айтылгандай, медициналык чечимдерди талдоону кайра карап чыгуу бул маселелерди принципиалдуу чечүүнү камсыздай алат.

 

Медициналык чечимдерди талдоо көптөгөн клиницисттерге жакшы тааныш эмес, бирок ал ыктымалдык ой жүгүртүүнү (чечим кабыл алууга байланыштуу белгисиз натыйжалар үчүн, мисалы, 1-сүрөттө көрсөтүлгөн талаштуу клиникалык сценарийде адамдын өсүү гормонун башкаруу керекпи же жокпу) жана эске алуу факторлорун (бул натыйжаларга тиркелген субъективдүү маанилер үчүн, алардын мааниси "cm2" сыяктуу жогорулашын айырмалай алат. эркек бийиктиги), татаал медициналык чечимдерди системалуу чечимдерди камсыз кылуу. Чечимди талдоодо клиниктер алгач ар бир натыйжага байланыштуу бардык мүмкүн болгон чечимдерди жана ыктымалдуулуктарды аныктап, андан кийин эң ылайыктуу вариантты тандоо үчүн ар бир натыйжага байланыштуу пациентти (же башка тарапты) камтышы керек. Демек, чечимди талдоо негиздүүлүгү натыйжаларды орнотуу комплекстүү экендигине, ошондой эле пайдалуулукту өлчөө жана ыктымалдыкты баалоо так экендигине көз каранды. Идеалында, бул ыкма чечимдердин далилдүү жана бейтаптын каалоосу менен шайкеш келишин камсыз кылууга жардам берет, ошону менен объективдүү маалыматтар менен жеке баалуулуктардын ортосундагы ажырымды кыскартат. Бул ыкма медицина тармагына бир нече ондогон жылдар мурун киргизилген жана жеке пациенттин чечим кабыл алуусунда жана калктын ден соолугун баалоодо колдонулат, мисалы, жалпы калкка ичеги рагынын скрининги боюнча сунуштарды берүү.

 

Медициналык чечимдерди талдоодо пайдалуулукту алуу үчүн ар кандай ыкмалар иштелип чыккан. Көпчүлүк салттуу ыкмалар түздөн-түз жеке пациенттерден баалуулуктарды алышат. Эң жөнөкөй ыкма – рейтинг шкаласын колдонуу, мында пациенттер санариптик шкала боюнча белгилүү бир натыйжага артыкчылык берүү деңгээлин баалашат (мисалы, 1ден 10го чейинки сызыктуу шкала), эң экстремалдуу ден соолук натыйжалары (мисалы, толук ден соолук жана өлүм) эки четинде жайгашкан. Убакыт алмашуу ыкмасы дагы бир көп колдонулган ыкма болуп саналат. Бул ыкмада бейтаптар ден соолугунун начарлаган мезгилинин ордуна канча убакыт өткөрүүгө даяр экендиктери жөнүндө чечим кабыл алышы керек. Стандарттык кумар ыкмасы пайдалуулугун аныктоо үчүн дагы бир көп колдонулган ыкма болуп саналат. Бул ыкмада бейтаптарга эки варианттын кайсынысын жактырары суралат: же белгилүү бир ыктымалдык (р) (t) менен нормалдуу ден соолукта белгилүү бир сандагы жыл жашайт жана 1-п ыктымалдыгы менен өлүм коркунучун көтөрөт; Же ден-соолукка байланыштуу шарттарда t жыл жашашыңыз керек. Пациенттерден кандайдыр бир вариантка артыкчылык бергиче, ар кандай p-бааларында бир нече жолу сураңыз, ошондуктан пайдалуулукту пациенттердин жоопторуна жараша эсептөөгө болот.
Пациенттин жеке каалоолорун аныктоо үчүн колдонулган ыкмалардан тышкары, пациенттердин калкы үчүн пайдалуулукту алуу ыкмалары да иштелип чыккан. Айрыкча фокус-топтук талкуулар (белгилүү тажрыйбаларды талкуулоо үчүн бейтаптарды чогултуу) алардын көз карашын түшүнүүгө жардам берет. Топтун пайдалуулугун эффективдүү бириктирүү үчүн ар кандай структуралаштырылган топтук талкуулоо ыкмалары сунушталган.
Практикада клиникалык диагностика жана дарылоо процессине пайдалуулукту түз киргизүү абдан көп убакытты талап кылат. Чечим катары, сурамжылоо анкеталары, адатта, калктын деңгээлинде пайдалуу баллдарды алуу үчүн кокусунан тандалган популяцияларга бөлүштүрүлөт. Кээ бир мисалдар EuroQol 5 өлчөмдүү анкета, 6 өлчөмдүү пайдалуу салмагы кыска түрү, Health Utility Index жана Рак өзгөчө европалык Рак изилдөө жана дарылоо уюмунун жашоо сапаты сурамжылоо Core 30 куралы кирет.


Посттун убактысы: 01-01-2024