Ang Dakong Modelo sa Pinulongan (LLM) makasulat ug makapadani nga mga artikulo base sa mga pulong nga dali, makapasar sa mga eksamin sa kahanas sa propesyonal, ug magsulat nga mahigalaon ug mabination nga impormasyon sa pasyente. Bisan pa, dugang pa sa nahibal-an nga mga peligro sa fiction, fragility, ug dili tukma nga mga kamatuoran sa LLM, ang uban nga wala masulbad nga mga isyu anam-anam nga nahimong sentro, sama sa mga modelo sa AI nga adunay potensyal nga diskriminasyon nga "mga hiyas sa tawo" sa ilang paglalang ug paggamit, ug bisan kung ang LLM wala na naggama sa sulud ug nagwagtang sa tin-aw nga makadaot nga mga sangputanan sa output, ang "mga kantidad sa LLM" mahimo’g motipas.
Dili maihap nga mga pananglitan ang nag-ilustrar kung giunsa ang datos nga gigamit sa pagbansay sa mga modelo sa AI nag-encode sa indibidwal ug sosyal nga mga mithi, nga mahimong molig-on sa sulod sa modelo. Kini nga mga pananglitan naglakip sa usa ka lain-laing mga aplikasyon, lakip na ang awtomatik nga interpretasyon sa chest X-ray, klasipikasyon sa mga sakit sa panit, ug algorithmic nga paghimog desisyon bahin sa medikal nga alokasyon. Sama sa gipahayag sa usa ka bag-o nga artikulo sa among journal, ang mapihigon nga datos sa pagbansay mahimong mopadako ug magpadayag sa mga mithi ug mga pagpihig nga anaa sa katilingban. Sa kasukwahi, gipakita usab sa panukiduki nga ang AI mahimong magamit aron makunhuran ang bias. Pananglitan, ang mga tigdukiduki nag-aplay ug lawom nga mga modelo sa pagkat-on sa mga salida sa X-ray sa tuhod ug nakadiskubre sa mga hinungdan nga wala makuha sa sukaranan nga mga timailhan sa kagrabe (gigrado sa mga radiologist) sa sulod sa lutahan sa tuhod, sa ingon nakunhuran ang wala mahibal-an nga mga kalainan sa kasakit tali sa itom ug puti nga mga pasyente.
Bisan kung nagkadaghan ang mga tawo nga nakaamgo sa pagpihig sa mga modelo sa AI, labi na sa mga termino sa datos sa pagbansay, daghang uban pang mga punto sa pagsulod sa mga kantidad sa tawo ang wala hatagan igong pagtagad sa proseso sa pagpalambo ug pag-deploy sa mga modelo sa AI. Ang medikal nga AI bag-o lang nakab-ot ang impresibo nga mga resulta, apan sa usa ka dako nga gidak-on, wala kini tin-aw nga gikonsiderar ang mga hiyas sa tawo ug ang ilang interaksyon sa pagsusi sa peligro ug probabilistikong pangatarungan, ni kini gimodelo.
Aron ma-concretize kining abstract nga mga konsepto, hunahunaa nga ikaw usa ka endocrinologist nga gikinahanglan nga magreseta sa recombinant human growth hormone alang sa usa ka 8-anyos nga batang lalaki nga ubos sa 3rd percentile sa iyang edad. Ang stimulated nga lebel sa hormone sa pagtubo sa tawo sa bata ubos sa 2 ng/mL (reference value,>10 ng/mL, reference value sa daghang nasod sa gawas sa United States kay>7 ng/mL), ug ang iyang human growth hormone coding gene nakamatikod sa talagsaong inactivation mutations. Kami nagtuo nga ang paggamit sa therapy sa hormone sa pagtubo sa tawo klaro ug dili malalis sa kini nga klinikal nga kahimtang.
Ang paggamit sa human growth hormone therapy sa mosunod nga mga sitwasyon mahimong hinungdan sa kontrobersiya: ang gitas-on sa 14-anyos nga batang lalaki kanunay anaa sa ika-10 nga porsyento sa iyang mga kaedad, ug ang kinapungkayan sa human growth hormone human sa stimulation mao ang 8 ng/mL. Wala'y nahibal-an nga mutation sa functional nga makaapekto sa gitas-on, o uban pang nahibal-an nga hinungdan sa mubo nga gidak-on, ug ang iyang edad sa bukog 15 ka tuig ang edad (ie walay paglangan sa paglambo). Bahin lamang sa kontrobersiya tungod sa mga kalainan sa mga kantidad sa threshold nga gitino sa mga eksperto base sa daghang mga pagtuon bahin sa lebel sa hormone sa pagtubo sa tawo nga gigamit alang sa pagdayagnos sa nahilit nga kakulangan sa pagtubo sa hormone. Labing menos ang daghang kontrobersiya naggikan sa balanse sa benepisyo sa peligro sa paggamit sa therapy sa hormone sa pagtubo sa tawo gikan sa mga panan-aw sa mga pasyente, pasyente nga mga ginikanan, mga propesyonal sa pag-atiman sa panglawas, kompanya sa parmasyutiko, ug mga nagbayad. Mahimong timbangon sa mga endocrinologist sa bata ang talagsaon nga dili maayo nga mga epekto sa adlaw-adlaw nga pag-injection sa growth hormone sulod sa 2 ka tuig nga adunay posibilidad nga wala o gamay ra nga pagtubo sa gidak-on sa lawas sa hamtong kung itandi sa karon. Ang mga batang lalaki mahimong magtuo nga bisan kung ang ilang gitas-on mahimo’g motaas lamang sa 2 cm, angay nga i-inject ang hormone sa pagtubo, apan ang tigbayad ug kompanya sa parmasyutiko mahimong adunay lainlaing mga panan-aw.
Gikuha namo ang creatinine based eGFR isip usa ka pananglitan, nga usa ka kaylap nga gigamit nga renal function indicator alang sa pagdayagnos ug pagpahigayon sa chronic kidney disease, pagtakda sa kidney transplant o donasyon nga mga kondisyon, ug pagtino sa pagkunhod sa mga criteria ug contraindications alang sa daghang mga tambal nga gireseta. Ang EGFR usa ka yano nga equation sa regression nga gigamit sa pagbanabana sa gisukod nga glomerular filtration rate (mGFR), nga usa ka reference standard, apan ang pamaagi sa pagtimbang-timbang medyo hasol. Kini nga regression equation dili maisip nga usa ka AI model, apan kini naghulagway sa daghang mga prinsipyo mahitungod sa tawhanong mga bili ug probabilistic nga pangatarungan.
Ang una nga punto sa pagsulod sa mga kantidad sa tawo nga mosulod sa eGFR mao ang pagpili sa datos alang sa angay nga mga equation. Ang orihinal nga pila nga gigamit sa pagdesinyo sa eGFR nga pormula kasagaran gilangkuban sa itom ug puti nga mga partisipante, ug ang pagkagamit niini sa daghang uban pang mga etniko nga grupo dili klaro. Ang mosunod nga mga punto sa pagsulod alang sa tawhanong mga bili niini nga pormula naglakip sa: pagpili sa mGFR accuracy isip ang nag-unang tumong sa pagtimbang-timbang sa function sa kidney, unsa ang usa ka madawat nga lebel sa katukma, unsaon pagsukod sa katukma, ug paggamit sa eGFR isip usa ka threshold sa pag-trigger sa clinical decision-making (sama sa pagtino sa mga kondisyon alang sa kidney transplant o pagreseta sa tambal). Sa katapusan, kung gipili ang sulud sa modelo sa pag-input, ang mga kantidad sa tawo mosulod usab niini nga pormula.
Pananglitan, sa wala pa ang 2021, gisugyot sa mga giya ang pag-adjust sa lebel sa creatinine sa pormula sa eGFR base sa edad sa pasyente, gender, ug lahi (giklasipikar lang nga itom o dili itom nga mga indibidwal). Ang pag-adjust base sa lumba gitumong sa pagpauswag sa katukma sa pormula sa mGFR, apan sa 2020, ang mga dagkong ospital nagsugod sa pagkuwestiyon sa paggamit sa eGFR nga gibase sa lumba, nga nagkutlo sa mga rason sama sa paglangan sa eligibility sa pasyente alang sa pagbalhin ug pagkonkreto sa lumba isip biological nga konsepto. Gipakita sa panukiduki nga ang pagdesinyo sa mga modelo sa eGFR sa termino sa lumba mahimong adunay lawom ug lainlain nga epekto sa katukma ug klinikal nga sangputanan; Busa, ang pinili nga pagtutok sa katukma o pagtutok sa usa ka bahin sa mga resulta nagpakita sa mga paghukom sa bili ug mahimong magtakuban sa dayag nga paghimog desisyon. Sa kataposan, ang nasudnong pundok sa pagtrabaho misugyot og bag-ong pormula nga gihaom pag-usab nga walay pagkonsiderar sa lumba sa pagbalanse sa mga isyu sa performance ug patas. Kini nga pananglitan nagpakita nga bisan ang usa ka yano nga klinikal nga pormula adunay daghang mga punto sa pagsulod sa mga kantidad sa tawo.
Kung itandi sa mga klinikal nga pormula nga adunay gamay ra nga gidaghanon sa mga predictive indicators, ang LLM mahimong naglangkob sa binilyon ngadto sa gatusan ka bilyon nga mga parameter (modelo nga gibug-aton) o labaw pa, nga nagpalisud sa pagsabut. Ang hinungdan ngano nga giingon namon nga "lisud sabton" mao nga sa kadaghanan sa mga LLM, ang eksakto nga paagi sa pagkuha sa mga tubag pinaagi sa pagpangutana dili mahimong mapa. Ang gidaghanon sa mga parameter alang sa GPT-4 wala pa gipahibalo; Ang gisundan niini nga GPT-3 adunay 175 bilyon nga mga parameter. Ang dugang nga mga parameter wala magpasabot nga mas lig-on nga mga kapabilidad, tungod kay ang mas gagmay nga mga modelo nga naglakip sa mas daghang computational cycles (sama sa LLaMA [Large Language Model Meta AI] nga serye sa modelo) o mga modelo nga maayong pagkahan-ay base sa feedback sa tawo mas maayo kay sa mas dagkong mga modelo. Pananglitan, sumala sa mga tig-assess sa tawo, ang modelo sa InstrumentGPT (usa ka modelo nga adunay 1.3 bilyon nga mga parameter) labaw sa GPT-3 sa pag-optimize sa mga resulta sa output sa modelo.
Ang piho nga mga detalye sa pagbansay sa GPT-4 wala pa gibutyag, apan ang mga detalye sa miaging henerasyon nga mga modelo lakip na ang GPT-3, InstrumentGPT, ug daghan pang uban nga open-source nga LLMs nabutyag na. Karong panahona, daghang mga modelo sa AI ang adunay mga kard nga modelo; Ang ebalwasyon ug datos sa seguridad sa GPT-4 gipatik sa susamang sistema card nga gihatag sa modelo nga kompanya sa paghimo sa OpenAI. Ang pagmugna sa LLM mahimong halos bahinon sa duha ka yugto: ang inisyal nga pre-training stage ug ang fine-tuning nga yugto nga gitumong sa pag-optimize sa mga resulta sa modelo nga output. Sa pre training stage, ang modelo gihatagan og dakong corpus lakip na ang orihinal nga Internet text aron mabansay kini sa pagtagna sa sunod nga pulong. Kining daw yano nga "awtomatikong pagkompleto" nga proseso nagpatunghag usa ka gamhanan nga pundasyon nga modelo, apan kini mahimo usab nga mosangpot sa makadaot nga kinaiya. Ang mga mithi sa tawo mosulod sa pre training stage, lakip ang pagpili sa pre training data para sa GPT-4 ug pagdesisyon nga tangtangon ang dili angay nga content sama sa pornographic content gikan sa pre training data. Bisan pa sa kini nga mga paningkamot, ang sukaranan nga modelo mahimo’g dili gihapon mapuslanon o makahimo nga adunay sulud nga makadaot nga mga sangputanan sa output. Sa sunod nga yugto sa pagpino, daghang mapuslanon ug dili makadaot nga pamatasan ang motungha.
Sa yugto sa fine-tuning, ang pamatasan sa mga modelo sa lengguwahe kasagarang mabag-o pag-ayo pinaagi sa supervised fine-tuning ug reinforcement nga pagkat-on base sa feedback sa tawo. Sa supervised fine-tuning stage, ang mga gisuholan nga contractor personnel magsulat og mga ehemplo sa tubag alang sa mga dinaliang pulong ug direktang magbansay sa modelo. Sa yugto sa pagkat-on sa pagpalig-on base sa feedback sa tawo, ang mga evaluator sa tawo mag-sort sa mga resulta sa modelo nga output isip mga pananglitan sa sulud sa input. Dayon i-apply ang mga resulta sa pagtandi sa ibabaw aron mahibal-an ang "modelo sa ganti" ug dugang nga mapaayo ang modelo pinaagi sa pagkat-on sa pagpalig-on. Ang katingad-an nga ubos nga lebel sa pag-apil sa tawo mahimo’g maayo ang pagpahiangay niining dagkong mga modelo. Pananglitan, ang modelo sa InstrumentGPT migamit sa usa ka grupo sa gibana-bana nga 40 ka mga kontraktor nga mga personahe nga gi-recruit gikan sa crowdsourcing nga mga website ug nakapasar sa usa ka screening test nga gitumong sa pagpili sa usa ka grupo sa mga annotator nga sensitibo sa mga gusto sa lain-laing mga grupo sa populasyon.
Sama sa gipakita niining duha ka grabe nga mga pananglitan, nga mao ang yano nga klinikal nga pormula [eGFR] ug ang kusgan nga LLM [GPT-4], ang paghimog desisyon sa tawo ug mga mithi sa tawo adunay hinungdanon nga papel sa paghulma sa mga sangputanan sa output sa modelo. Makuha ba niini nga mga modelo sa AI ang ilang lainlaing mga kantidad sa pasyente ug doktor? Giunsa paggiya sa publiko ang paggamit sa AI sa medisina? Sama sa nahisgutan sa ubos, ang usa ka pagsusi pag-usab sa pag-analisar sa desisyon sa medikal mahimong maghatag usa ka prinsipyo nga solusyon sa kini nga mga isyu.
Ang pag-analisar sa medikal nga desisyon dili pamilyar sa daghang mga clinician, apan kini makaila tali sa probabilistic nga pangatarungan (alang sa dili sigurado nga mga resulta nga may kalabutan sa paghimog desisyon, sama sa pag-administer sa human growth hormone sa kontrobersyal nga clinical scenario nga gipakita sa Figure 1) ug mga hinungdan sa konsiderasyon (alang sa suhetibong mga bili nga gilakip niini nga mga resulta, nga naghatag og bili sa usa ka gitas-on sa usa ka cm), solusyon alang sa komplikadong medikal nga mga desisyon. Sa pagtuki sa desisyon, ang mga clinician kinahanglan una nga mahibal-an ang tanan nga posible nga mga desisyon ug mga kalagmitan nga nalangkit sa matag sangputanan, ug dayon ilakip ang utility sa pasyente (o uban pang partido) nga kauban sa matag sangputanan aron mapili ang labing angay nga kapilian. Busa, ang kabalido sa pag-analisa sa desisyon nagdepende kung komprehensibo ang setting sa sangputanan, ingon man kung tukma ba ang pagsukod sa utility ug ang pagbanabana sa posibilidad. Sa tinuud, kini nga pamaagi makatabang sa pagsiguro nga ang mga desisyon base sa ebidensya ug nahiuyon sa mga gusto sa pasyente, sa ingon gipakunhod ang gintang tali sa katuyoan nga datos ug personal nga mga kantidad. Kini nga pamaagi gipaila sa medikal nga natad pipila na ka dekada ang milabay ug gigamit sa indibidwal nga pagdesisyon sa pasyente ug pagtimbangtimbang sa kahimsog sa populasyon, sama sa paghatag mga rekomendasyon alang sa screening sa colorectal cancer sa kinatibuk-ang populasyon.
Sa pag-analisa sa desisyon sa medikal, lainlain nga mga pamaagi ang gihimo aron makuha ang kapuslanan. Kadaghanan sa tradisyonal nga mga pamaagi direkta nga makakuha og bili gikan sa indibidwal nga mga pasyente. Ang pinakasimple nga paagi mao ang paggamit sa usa ka rating scale, diin ang mga pasyente mag-assess sa ilang lebel sa pagpalabi alang sa usa ka resulta sa digital scale (sama sa linear scale gikan sa 1 ngadto sa 10), nga adunay pinakagrabe nga resulta sa panglawas (sama sa hingpit nga panglawas ug kamatayon) nga nahimutang sa duha ka tumoy. Ang paagi sa pagbayloay sa oras maoy laing kasagarang gigamit nga paagi. Niini nga pamaagi, ang mga pasyente kinahanglan nga maghimo usa ka desisyon kung unsa ka daghang himsog nga oras ang andam nilang igugol baylo sa usa ka panahon sa dili maayo nga kahimsog. Ang standard nga pamaagi sa sugal maoy lain nga kasagarang gigamit nga pamaagi sa pagdeterminar sa gamit. Niini nga pamaagi, ang mga pasyente gipangutana kung hain sa duha ka mga kapilian ang ilang gusto: mabuhi ang usa ka piho nga gidaghanon sa mga tuig sa normal nga kahimsog nga adunay usa ka piho nga kalagmitan (p) (t), ug mag-antus sa peligro sa kamatayon nga adunay posibilidad nga 1-p; Siguruha nga mabuhi sulod sa t ka tuig ubos sa mga kahimtang sa kahimsog. Pangutan-a ang mga pasyente sa makadaghang higayon sa lain-laing mga p-values hangtod nga wala sila'y gusto sa bisan unsang opsyon, aron ang utility makalkulo base sa mga tubag sa pasyente.
Gawas pa sa mga pamaagi nga gigamit aron makuha ang indibidwal nga mga gusto sa pasyente, ang mga pamaagi gihimo usab aron makuha ang gamit para sa populasyon sa pasyente. Ilabi na ang focus group discussions (paghiusa sa mga pasyente aron hisgutan ang piho nga mga kasinatian) makatabang nga masabtan ang ilang mga panglantaw. Aron epektibo nga mahiusa ang mga gamit sa grupo, lainlain nga istruktura nga mga pamaagi sa panaghisgot sa grupo ang gisugyot.
Sa praktis, ang direkta nga pagpaila sa utility sa klinikal nga pagdayagnos ug proseso sa pagtambal dugay kaayo. Isip solusyon, ang mga pangutana sa surbey kasagarang ipang-apod-apod sa mga pinili nga populasyon aron makakuha og mga marka sa gamit sa lebel sa populasyon. Ang ubang mga pananglitan naglakip sa EuroQol 5-dimensional nga pangutana, ang 6-dimensional nga utility weight short form, ang Health Utility Index, ug ang Cancer Specific European Cancer Research and Treatment Organization Quality of Life Questionnaire Core 30 tool.
Oras sa pag-post: Hunyo-01-2024




