Biz bir iletişim kuralı ve ilişkili meta veriler şablonu klinik olgu sunumları Biyomedikal kavramları açıklayan bir metin çıkarım için mevcut. Bu protokolü ile üretilen yapılandırılmış metin değerleri derinlemesine analiz klinik anlatıları binlerce destekleyebilir.
Klinik olgu sunumları (CCRs) gözlemler ve tıpta anlayışlar paylaşımı değerli bir anlamı vardır. Bu belgeler şeklinde değişir ve içeriklerini açıklamaları içeren çok sayıda, roman hastalık sunumlar ve tedavileri. Şimdiye kadar metin veri CCRs içinde büyük ölçüde yapılandırılmamış, bu veriler derinlemesine analiz için yararlı işlemek için önemli insan ve hesaplamalı çaba gerektiren. Bu protokol için sık sık gözlenen CCRs içinde belirli Biyomedikal kavramlarına karşılık gelen meta veriler tanımlayan yöntemleri açıklanmaktadır. Biz bir meta veri şablonu bir kılavuz olarak belge ek bilgi için CCRs yapısına heybetli el ile ve otomatik çaba kombinasyonları tarafından takip edilebilir bu tanıma sağlar. Burada sunulan yaklaşım uygun metin kavramı ile ilgili organizasyonu için bir büyük edebiyat corpus (Örneğin, binlerce CCRs olan) ancak daha odaklı görevleri veya küçük rapor kümesi kolaylaştırmak için kolayca adapte olabilir. Sonuç yapılandırılmış metin verileri sonraki metni analiz iş akışları çeşitli desteklemek için yeterli anlamsal bağlamda içerir: meta-analizler CCR maksimize etmek nasıl belirlemek için ayrıntılı, epidemiyolojik çalışmalar nadir hastalıklar ve modellerinin geliştirilmesi Tıbbi dil tüm daha gerçekleşebilir ve yönetilebilir yapılandırılmış metin veri kullanımı ile yapılabilir.
Klinik olgu sunumları (CCRs) gözlemler ve tıpta anlayışlar paylaşımı için temel bir yol vardır. Bunlar, iletişim ve eğitim klinisyenler ve tıp öğrencileri için temel bir mekanizma olarak hizmet vermektedir. Tarihsel olarak, CCRs aynı zamanda ortaya çıkan hastalıkların hesapları, kendi tedavileri ve onların genetik arka planlar1,2,3,4hazırladık. Örneğin, insan kuduz Louis Pasteur 18855,6 tarafından ilk tedavisinde ve penisilin7 vardı hastalarda ilk uygulama her ikisi de CCRs bildirdi. 1.87 milyondan fazla CCRs aynı derecede-in Nisan 2018, son on yıl içinde yarım milyon ile yayınlanmış; günlükleri yeni mekanları için bu raporları8sağlamak devam etmektedir. Benzersiz olmasına rağmen biçim ve içerik, CCRs büyük ölçüde yapılandırılmamış metin verilerini içeren, geniş bir kelime içeren ve birbiriyle ilişkili olaylar, bunların kullanımı yapılandırılmış bir kaynak olarak sınırlama endişe. Önemli çaba ayrıntılı meta veriler ayıklamak için gereklidir (Yani, “veriler hakkında veri”, ya da bu durumda, belge içeriğini açıklamalarını) CCRs gelen ve onları bulunabilmesini, erişilebilir, birlikte çalışabilir ve yeniden kullanılabilir (adil)9 veri olarak kurmak kaynak.
Burada, metin ve sayısal yayımlanmış CCRs içinde belirli Biyomedikal kavramları açıklaması standartlaştırmak için değerleri ayıklamak için bir işlemi açıklar. Bu metodoloji ek açıklama rehberlik için bir meta veri şablonu içerir; Bu işlemine genel bakış için bkz. Şekil 1 . Ek açıklama işlemi uygulama raporları geniş bir koleksiyon için (Örneğin, birkaç bin hastalık sununun belirli bir türdeki) makine sistemi tarafından okunabilen elde derleme açıklamalı klinik metinler, yönetilebilir ve yapılandırılmış bir dizi verir belgeleri ve Biyomedikal olayları her klinik sunu içinde gömülü. HL7 tarafından verilen gibi veri biçimleri rağmen (e.g., sürüm 3 ileti standart10 veya11hızlı sağlık birlikte çalışabilirlik kaynakları [FHIR]), LOINC12ve revizyon 10 Uluslararası istatistik Hastalıkları ve ilgili sağlık sorunları (ICD-10) sınıflandırılması13 sağlayın standartlar tanımlamak ve klinik gözlemler alışverişi için bu veri çevreleyen metin yakalama değil, ne de onlar için içindir. Metodolojimiz sonuçlarını en iyi CCRs yapısına uygulamak ve daha sonraki analiz, normalleştirme kontrollü terimlerini ve kodlama sistemleri aracılığıyla kolaylaştırmak için kullanılır (Örn., ICD-10), ve/veya yukarıda listelenen klinik veri biçimlerini dönüştürme .
CCRs madencilik içinde biyomedikal ve klinik bilişim çalışmalarının etkin bir alandır. Önceki teklif yapısını standartlaştırmak için raporları durumda olsa (Örn., HL7 v2.514 kullanarak veya standart fenotip terminoloji15) övgüye değer, CCRs farklı çeşitli takip etmeye devam büyük olasılıkla vardır doğal dil formlar ve belge düzenleri son yüzyıl için var onlar. İdeal koşullar altında Yeni olgu sunumları yazarlarının kapsamlı olduklarından emin olmak için bakım kuralları16 izleyin. Tıbbi kavramlarına hem doğal dil ve ilişkisi duyarlı yaklaşımlar bu nedenle yeni ve arşivlenmiş raporları ile çalışma en etkili olabilir. CRAFT17 ve bu gibi kaynakları entegre biyoloji için Bilişim tarafından üretilen ve başucu (i2b2)18 küratörlüğü doğal dil işleme (NLP) yaklaşımlar destek henüz CCRs veya klinik anlatıları özellikle odak yok. Benzer şekilde, cTAKES19 ve kelepçe20 gibi tıbbi NLP araçları geliştirilmiştir ancak genellikle belirli sözcükleri veya deyimleri (Örneğin, varlıklar) yaygın olarak CCRs içinde açıklanan genel kavramlar yerine belgeler içinde tanımlamak.
Standart meta veri şablonu yaygın olarak CCRs içinde bulunan özellikleri için tasarladık. Bu şablonu CCRs yapısına dayatmaya özellikleri tanımlar — belge içeriğini ayrıntılı karşılaştırmalar için bir temel öncül-henüz anlamsal bağlamda korumak yeterli esneklik sağlar. Biz el ile ek açıklama ve hesaplama açısından yardımlı metin madenciliği için uygun olacak şekilde bu şablonla ilişkilendirilmiş biçimi tasarladık rağmen özellikle için el ile annotators kolay sağlamıştır. Bizim yaklaşım belirgin çerçeveler FHIR21gibi daha karmaşık gelen (ve bu nedenle, eğitimsiz için hemen anlaşılabilir araştırmacılar daha az) farklıdır. Aşağıdaki iletişim kuralı tek bir CCR, olanlar için karşılık gelen değerleri tek bir set ile her şablon veri türüne karşılık gelen belge özelliklerini yalıtmak nasıl açıklar.
Şablon içinde veri türleri CCRs ve tıbbi belgeleri hasta odaklı için en açıklayıcı genel olarak bunlar. Ek açıklama bu özelliklerin findability, erişilebilirlik, birlikte çalışabilirlik ve CCR metin, yeniden kullanılırlığı öncelikle yapısı vererek teşvik etmektedir. Dört genel kategoride veri türleridir: belge ve ek açıklama tanımlama, olgu sunumu kimlik (Örneğin, belge düzeyi özellikleri), tıbbi içerik kavramları (Öncelikle kavram düzeyinde Özellikler) ve bildirimleri (yani kanıt finansman sağlayan özellikler). Bu ek açıklama işlemde, her belgenin herhangi bir belge içeriği malzeme durum (Örneğin, deneysel protokoller) bağımsız atlama bir CCR tam metnini içerir. CCRs genellikle az 1.000 kelime vardır; tek bir corpus ideal aynı bibliyografik veritabanı tarafından dizine olmamalıdır ve yazılı dilde olması.
Yaklaşım CCR corpus için uygulandığında burada, açıklanan ürün ek açıklama eklenen klinik metin yapılandırılmış bir kümesidir. Bu yöntem tamamen el ile yapılabilir ve etki alanı uzmanları Bilişim deneyimin olmadan gerçekleştirmesi için tasarlanmış olsa da, yukarıda belirtilen doğal dil işleme yaklaşımlar tamamlar ve veri için uygun sağlar sayısal analiz. Bu tür analizleri kitlelere olanlar da dahil olmak üzere CCRs, sık sık okumak ötesinde araştırmacıların ilgi olabilir:
CCRs yapısına uygulayan tıbbi dil ve Biyomedikal olayları daha iyi anlamak için çok sayıda sonraki çabalarını destekleyebilir.
Standart meta veri şablonu uygulanması için CCRs onların içerik daha adil yapmak, onların kitle genişletin ve uygulamalarını genişletmek. CCRs tıbbi iletişim eğitim araçları olarak geleneksel kullanımı, Sağlık Eğitim (Örneğin, tıp öğrencileri, stajyerler ve arkadaşlarının) ve Biyomedikal araştırmacıları özetlenen olgu sunumu içeriği etkinleştirmek daha hızlı bulabilirsiniz anlama. En büyük gücü ile CCRs, meta veriler belirli ancak, bu veri dönüşümler Aksi takdirde dizin oluşturma gözlemler yorumlanabilir kalıpları içine izole olduğunu. Bu iş akışı epidemiyolojik analizi, pazarlama sonrası ilaç veya tedavi gözetim veya daha geniş araştırmalar Patogenez veya tedavi edici etkinliği oluşur olup olmadığını burada sağlanan iletişim kuralı CCRs ile çalışmak için bir iş akışı için ilk adım olarak hizmet verebilir. Yapısal özellikler CCRs içinde tanımlanan hastalık sunumlar ve tedavisi, nadir koşulları özellikle odaklanarak araştırmacılar için yararlı bir kaynak sağlayabilir. Klinik araştırmacılar veri kaydedilmiş belirtiler ya da yan etkileri ve bakım altında önceki standartları geliştirme derecesini çözümlemek için son tedavi rejimleri bulabilirsiniz. Verileri da daha geniş analizler yeni tedavilerin etkinliğini, yan etkileri ya da toksisite, eksikliği veya cinsiyet, Yaş grubu ya da genetik arka plan farklılıkları hedefleme uyuşturucu temel kullanıyor.
Yapılandırılmış meta verileri tarafından sağlanan yararları benzer şekilde ayrıştırma veya tıbbi dil modelleme için tasarlanmış Hesaplamalı iş akışları için geçerlidir. Yapılandırılmış CCR özellikleri de kanıt nerede rapor yazarları daha kolay makine sistemi tarafından okunabilen sağlayabilir alanların (ve bazı durumlarda, okunabilir) içeriği sağlayabilir. CCRs arasında farkı açıkça sağlanan gözlemler eksikliğinden neden olur: bir hastanın kesin yaş belirtilen mesela . Tanılama veya bunların sonuçları önemsiz kabul edildi Eğer benzer şekilde, klinisyenler testleri kızlar. Boşluklar derinlemesine analiz için gerekli örnekleri sağlayarak, CCRs yapısına uygulayan potansiyel iyileştirmeler vurgulamaktadır. Daha geniş bir perspektif içinde doğal dil işleme (NLP) çabaları sağlık24,25büyük veri öğrenmek için yapılandırılmış metin veri tıbbi belgelerden daha fazla kullanılabilirlik destekler.
The authors have nothing to disclose.
Bu eser kısmen Ulusal Kalp, akciğer ve kan Enstitüsü tarafından desteklenmiştir: R35 HL135772 (için s. Ping); Genel tıbbi Bilimler Ulusal Enstitüsü: U54 GM114833 (için s. Ping, K. Watson ve W. Wang); Ulusal Enstitüsü Biyomedikal görüntüleme ve Biyomühendislik: T32 EB016640 (için A. Bui); Hoag Vakfı ve Dr. S. Setty hediyesi; ve UCLA (için s. Ping) T.C. Laubisch bağış.
A corpus of clinical case reports | n/a | n/a | Full texts of case reports may be accessed through PubMed (e.g., using the search query "Case Reports"[Filter]), other citation databases such as Europe PMC (https://europepmc.org/) or directly through publishers. |