2022年9月28日水曜日

long COVIDに関する機械学習に基づく患者特性とproteomic特性に関する報告2つ

long COVIDに関する機械学習に基づく患者特性とproteomic特性に関する報告2つ


 


Plasma proteomic signature predicts who will get persistent symptoms following SARS-CoV-2 infection, EBioMedicine (2022). DOI: 10.1016/j.ebiom.2022.104293




eBioMedicineに掲載されたこの研究は、SARS-CoV-2に感染した医療従事者の血液中のタンパク質を分析し、感染していない医療従事者のサンプルと比較したもの

研究チームは、人工知能(AI)アルゴリズムを使用して、さまざまなタンパク質の存在量に「サイン」を特定し、感染から1年後に症状が持続するかどうかを予測することに成功、軽度あるいは無症状のCOVID-19でさえ、血漿中のタンパク質のプロファイルを乱すことを示している

標的質量分析法(血漿中のタンパク質の量のわずかな変化に極めて敏感な分析法)を用いて、COVID-19が6週間の間にこれらのタンパク質にどのような影響を及ぼしたかを調べたもの

SARS-CoV-2感染者では、調査した91種類のタンパク質のうち12種類が異常に多く、その異常の程度は症状の重さと相関している

なくとも1つの持続的症状を報告した11人の医療従事者全員を、1年後に持続的症状を報告しなかった感染した医療従事者と区別することができた。別の機械学習ツールを用いて誤差の可能性を推定したところ、この手法の誤差は6%となる可能性が示唆された



ビッグデータによるモデル化したマシン・ラーニング

Identifying who has long COVID in the USA: a machine learning approach using N3C data

Emily R Pfaff, et al.

Open AccessPublished:May 16, 2022

DOI:https://doi.org/10.1016/S2589-7500(22)00048-6

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(22)00048-6/fulltext

背景

SARS-CoV-2感染による急性期以降の後遺症は、long COVIDとして知られ、COVID-19パンデミックからの回復に患者や社会にとって深刻な影響を及ぼしている。長期COVIDは、進化する異質な症状によって特徴付けられ、明確な定義を導き出すことは困難である。電子カルテの研究は、米国国立衛生研究所のRECOVER Initiativeの重要な要素であり、long COVIDの理解、治療法の特定、患者の正確な特定が急務であることから、本研究では後者を目的とした。

 研究方法

National COVID Cohort Collaborative(N3C)の電子カルテリポジトリを使用して、長いCOVIDを持つ可能性のある患者を特定するためにXGBoost機械学習モデルを開発した。基本集団(n=1 793 604)を、入院または救急受診による国際疾病分類-10-臨床修正COVID-19診断コード(U07.1)、またはSARS-CoV-2 PCRもしくは抗原検査陽性で、COVID-19インデックス日から少なくとも90日経過した非死亡成人患者(年齢18歳以上)と定義した。COVID-19を発症した成人97 995人の人口統計学,医療利用,診断,投薬について検討した.これらの特徴に関するデータと長期COVIDクリニックの患者597人を用いて,COVID-19の全患者,COVID-19で入院した患者,COVID-19を発症したが入院していない患者から長期COVIDの可能性を特定する3つの機械学習モデルを学習させた。特徴の重要度はシャープレイ値によって決定された。さらに、4番目の施設のデータでモデルを検証した。

結果

我々のモデルは、受信者動作特性曲線下面積が0-92(全患者)、0-90(入院患者)、0-85(非入院患者)となり、高い精度でCOVIDが長いと思われる患者を特定することができた。シャープレイ値で定義される重要な特徴には、ヘルスケア利用率、患者の年齢、呼吸困難、および電子カルテ内で利用可能なその他の診断と投薬の情報が含まれる。

解釈

モデルによって長期COVIDの可能性があると同定された患者は、長期COVIDの専門クリニックでのケアを保証する患者と解釈できます。これは、その定義が進化し続けているため、長期COVID診断の不可欠な代用品となります。また、臨床試験の対象となる患者の潜在的な長時間のCOVIDを特定するという緊急の目標も達成されます。より多くのデータソースが特定されれば、モデルは個々の研究の必要性に基づいて再トレーニングやチューニングを行うことができます。


これからの医師はこの種の学習必須になってきていますな

高校ですら・・・これだし

google colab.に牛耳られているのってでもどうなのだろう?



0 件のコメント:

コメントを投稿

noteへ実験的移行

禁煙はお早めに! 米国における人種・民族・性別による喫煙・禁煙での死亡率相違|Makisey|note 日常生活内の小さな身体活動の積み重ねが健康ベネフィットをもたらす:VILPA|Makisey|note