Diese Studie vergleicht relationale und nicht relationale (NoSQL) standardisierten medizinischen Informationssystemen. Der Rechenaufwand der Antwortzeiten von Abfragen von solchen Datenbankmanagementsysteme (DBMS) wird anhand der Verdoppelung mittlere Datenbanken berechnet. Diese Ergebnisse helfen, die Diskussion über die Angemessenheit der einzelnen Datenbank-Ansätze für verschiedene Szenarien und Probleme.
Diese Forschung zeigt ein Protokoll zur Bewertung der Rechenkomplexität Abfragen relationale und nicht relationale (NoSQL (nicht nur Structured Query Language)) standardisierte elektronische Aufzeichnung (EHR) medizinische Informationen Datenbanksysteme (DBMS). Es verwendet einen Satz von drei Verdoppelung große Datenbanken, d.h. Datenbanken speichern von 5000, 10.000 und 20.000 realistische standardisiert EHR Extrakte, in drei verschiedenen Datenbankmanagementsysteme (DBMS): relationale MySQL Objekt-relationale Mapping (ORM) dokumentbasierte NoSQL MongoDB und native extensible Markup Language (XML) NoSQL vorhanden sind.
Die durchschnittlichen Antwortzeiten auf sechs Komplexität steigt Abfragen wurden berechnet, und die Ergebnisse zeigten ein lineares Verhalten in der NoSQL-Fällen. Im Feld NoSQL präsentiert MongoDB eine viel flachere lineare Steigung als eXist.
NoSQL-Systeme möglicherweise auch besser geeignet zu standardisierten medizinischen Informationssystemen aufgrund des besonderen Charakters der Update-Richtlinien von medizinischen Informationen, was die Konsistenz und Effizienz der NoSQL-Datenbanken gespeicherten Daten nicht beeinflussen sollte.
Eine Einschränkung dieses Protokolls ist die fehlende direkte Ergebnisse der verbesserten relationalen Systemen wie Archetyp relational Mapping (ARM) mit den gleichen Daten. Jedoch die Interpolation der Verdoppelung Größe Datenbankergebnisse zu denen in der Literatur vorgestellt und andere veröffentlichten Ergebnisse legt nahe, dass NoSQL-Systeme in vielen Szenarien und zu lösenden Probleme besser geeignet sein könnte. Z. B. NoSQL eignet sich möglicherweise für Dokumenten-basierte Aufgaben wie EHR Extrakte verwendet in klinische Praxis, Ausgabe und Visualisierung oder Situationen, wo das Ziel ist nicht nur, medizinische Abfrageinformationen, sondern auch um die EHR in genau ihrer ursprünglichen Form wiederherzustellen.
NoSQL (nicht nur SQL) DBMS sind vor kurzem als Alternative zu herkömmlichen relationalen DBMS (RDBMS) entstanden. RDBMS haben die Art und Weise beherrscht seit Jahrzehnten in Datenbanksystemen gespeichert wurden. Gut untersucht und verstanden relationale Algebra und Analysis haben die Effizienz und Konsistenz der RDBMS1garantiert. NoSQL-Systeme werden nicht Ersatz für relationale Systeme, aber sie könnte vorteilhaft Verhalten in bestimmten Situationen und unter verschiedenen Bedingungen.
Einige dieser bestimmten Szenarien und Bedingungen treten beim Entwerfen der Datenbank-Persistenz von Electronic Health Record (EHR) Systeme zur Verwaltung und Speicherung von medizinischen Informationen. Um interoperable und nachhaltig in der Praxis mehrere internationale Standards wie ISO/EN 13606, OpenEHR und HL72,3,4wurden,5 verwendet, um EHR Extrakte zu standardisieren.
Verschiedene Standards wie ISO/EN 13606 und OpenEHR haben Informationen und wissen in zwei verschiedenen Ebenen der Abstraktion, vertreten durch Referenz-Modell (RM) und spezielle Datenstrukturen genannt Archetypengetrennt. Diese Trennung ist oft das duale Modell genannt und EPA-Systemen semantisch interoperabel und medizinischem Wissen ohne Neuprogrammierung des Gesamtsystems EHR und infolgedessen zu entwickeln sein ermöglicht werden, wartbar und nachhaltig in der Praxis6 . Das duale Modell umgesetzt in standardisierten EPA-Systemen erfordert jedoch, dass die Organisation von Informationen einer bestimmten Struktur folgt, und dies hat tiefgreifende Auswirkungen auf die Weise ist der Datenbankebene Persistenz des Systems gestaltete7.
Objekt-relationale Mapping (ORM)-8 ist eine Methodik zur Umsetzung eines EPA-Systems mit dem relationalen Datenbank-Paradigma. ORM Karten ausführlich die Struktur der standardisierten EHR Extrakte XML (eXtensible Markup Language) Dateien vom System für eine relationale Datenbank verwendet. ORM baut viele relationale Tabellen umfassend entsprechend der Struktur der standardisierten EHR Auszüge XML-Dateien. Diese relationalen Tabellen sind durch viele Fremdschlüssel verknüpft und das resultierende System möglicherweise nicht sehr effizient.
Mehreren relationalen Verbesserungen in ORM sind vorgeschlagen worden. OpenEHR der Knoten + Pfad9 reduziert die Anzahl der relationalen Tabellen von serialisieren Teilstrukturen der Gesamtextrakt XML-Datei in BLOBs (binary Großobjekte). Allerdings verursacht diese Vereinfachung komplexer Abruf Logik, komplexe Abfragen zu beschädigen. Archetyp Relational Mapping (ARM)10 generiert ein Datenbankmodell angetrieben von Archetypen, Bau eines neuen relationalen Schemas basierend auf Zuordnungen zwischen Archetypen und relationalen Tabellen. Einige der nicht-medizinischen Informationen der EHR-Extrakt deshalb verloren.
Viele dokumentbasierte NoSQL-Datenbanken speichern Sie ganze Dokumente als gesamte BLOBs unter Beachtung einer ursprünglichen XML oder JSON (JavaScript Objekt Notation) Format. Dies bedeutet, dass keine relationalen Tabellen aufgebaut sind. Diese NoSQL-Datenbanken haben kein Schema, und sie unterstützen keine Verknüpfungen oder (Säure) Eigenschaften11, d. h., Unteilbarkeit, Konsistenz, Isolation oder Haltbarkeit. Dadurch können sie sehr ineffizient sein, wenn ein Element eines Dokuments verweist auf Elemente des gleichen oder anderen Schriftstücke unter Verwendung einen Dereferenzierung Link. Dies geschieht, weil, um Konsistenz zu gewährleisten, müssen die Gesamtheit der referenzierten Dokumente sequentiell abgearbeitet werden. Eine nicht-relationale Datenbank kann jedoch noch angemessen, wenn die Hauptaufgabe, durchgeführt durch das DBMS eine dokumentbasierte Aufgabe ist. Und zwar deshalb, weil Daten in Form mehr eng Annäherung sein getreues Abbild dokumentenbasierte NoSQL-Datenbank verwenden bleiben können, obwohl dies auch aufgrund der speziellen Ausdauer-Politik erreicht, indem EHR medizinische Unterlagen (siehe Diskussion).
Diese Methoden soll mehrere Experimente durchführen, um die Umsetzung der Persistenzschicht eine standardisierte EHR-System mit drei verschiedenen DBMS vergleichen zu präsentieren: eine relationale (MySQL) und zwei NoSQL (dokumentbasierte MongoDB und native XML vorhanden sein). Ihre Rechenkomplexität wurde berechnet und verglichen mit drei verschiedenen zunehmende Größe Datenbanken und sechs verschiedene größer werdende Komplexität Abfragen. Die drei Datenbankserver wurden installiert und lokal auf demselben Computer wo die Abfragen ausgeführt wurden konfiguriert. Tabelle der Materialien für technische Details anzeigen.
Parallelität Experimente wurden auch durchgeführt, um die Leistung der relationalen MySQL und NoSQL MongoDB DBMS zu vergleichen. Die beschriebenen ORM-Verbesserungen (Knoten + Pfad und ARM) wurden auch mit entsprechenden entsprechende Ergebnisse aus der Literatur10verglichen.
Datenbank-Management-Systeme werden kontinuierlich weiterentwickelt, mit einer rasanten Geschwindigkeit. Niemand würde diese exponentielle Entwicklung denken, wenn das einzige vorhandene Paradigma das relationale Modell war. Um ein Beispiel zu nennen, siehe z. B.12, wo wurde ein Modell vorgeschlagen, Reaktionszeit verbesserte relationale Datenbanken Beibehaltung der ACID-Eigenschaften zu implementieren.
Dieses Protokoll zeigt, dass rein relationale ORM-Systemen nicht praktisch für einzelne Patienten Abfragen (Q1, Q3 und Q4) scheinen, da die Reaktionszeiten sind langsamer, wahrscheinlich aufgrund einer hohen Anzahl von relationalen Tabellen viele teure Join-Operationen durchführen, und aufgrund der Storage-System durch die spezifische Art der Datenbank verwendet. NoSQL-Datenbanken speichern Daten in ein Dokument-basierte Mode, während relationale Systeme eine tabellenbasierten Mode verwenden, die jedes Dokument in der gesamten Datenbank verbreitet. NoSQL-Systeme zeigen eine lineare Steigung mit MongoDB Durchführung wesentlich schneller als DBMS vorhanden sind. Parallelität MongoDB verhält sich auch viel besser als relationale MySQL ORM7.
Dieses Protokoll stellt eine Problembehandlung Protokoll für die Ergebnisse, die in7 bezüglich der ORM-MySQL-DBMS. Das MySQL-System wurde auf die neueste Version aktualisiert und die Ergebnisse wurden geringfügig geändert. Darüber hinaus ist wie MongoDB ist, dass sie Konsistenz bewahren können, wenn medizinische Informationen7 speichern, denn wenn ein EHR Auszug aktualisiert wird, ist es nicht überschrieben, sondern eine ganze neue mit den neuen Daten zu extrahieren ein kritischer Punkt im Dokument-basierte NoSQL-Systeme erzeugt und im System gespeichert und der Stammwürze wird beibehalten. Dies ist eine strenge Anforderung von medizinischen Informationen, weil einige Ärzte wichtige medizinische Entscheidungen auf Basis der ursprünglichen Daten gebildet haben können.
Die verbesserte relationalen ARM System drastisch verringert sich die Anzahl der relationalen Tabellen und relationalen Leistung verbessert. Da es das relationale Schema ändert, medizinische Informationen im Besitz der Extrakte kann abgefragt werden, jedoch Auszüge nicht in ihrer genauen ursprünglichen Form wiederhergestellt werden.
Für sehr große Datenbanken in sekundären verwenden (Forschung), es nicht klar ist, welche Datenbank-System besser geeignet ist, da die All-Patient-Abfragen (Q2 und Q5) besser in ORM als NoSQL-Systeme Verhalten, aber diese Systeme eine bessere als die vereinfachte Leistung relationalen Systeme im 12. Wir betrachten Q6 eine spezielle Abfrage zwischen klinischen Praxis und sekundäre verwenden, deren Verhalten durch die Ergebnisse dieser Experimente bestimmt werden kann.
Eine Einschränkung der Methode ist jedoch die Nichtverfügbarkeit von direkten Experimenten vergleichen das verbesserte relationalen ARM-System mit NoSQL MongoDB über einzelne Patienten, medizinische Praxis Abfragen mit exakt die gleichen Daten in das Protokoll verwendet. Wir erhalten die Ergebnisse, die Interpolation von Tabelle 3 und Tabelle 5 über einzelne Patienten Abfragen, bis das Experiment auch optimierte ARM in das Protokoll durchgeführt wurde. Wir verlassen diese Experimente für zukünftige Anwendungen. Ein wichtiger Schritt im Rahmen des Protokolls ist die Auswahl der kostenlosen Datenbank, ähnliche Software-Versionen der letzten Jahre, so dass wir die genaue State-of-the-Art der drei Technologien vergleichen kann.
Dies ist einer der ersten Versuche, relationale direkt zu vergleichen und NoSQL-Systeme mit tatsächlichen, realistisch, standardisierte medizinische Informationen. Jedoch hängt am jeweiligen System verwendet werden stark von der tatsächlichen Szenario und Problem gelöst8sein.
The authors have nothing to disclose.
Die Autoren möchten Dr Dipak Kalra, Leiter der Task Force EHRCom danken, die der standard ISO/EN-13606 und sein Team vom University College London für ihre freundliche Genehmigung verwenden Sie das ISO/EN 13606 W3C XML-Schema definiert.
Diese Arbeit wurde unterstützt von Instituto de Salud Carlos III [Grantnummern PI15/00321, PI15/00003, PI1500831, PI15CIII/00010 und RD16CIII].
MySQL 5.7.20 | MySQL experiments | ||
Red Hat Enterprise Linux Server release 7.4 (Maipo), 2.60GHz, RAM 16GB | |||
MongoDB 2.6 | MongoDB experiments | ||
Windows 7, 2.66GHz, RAM 12GB | |||
eXist 3.0RC1 | eXist experiments | ||
Windows 7, 2.66GHz, RAM 12GB | |||
Studio 3T 5.5.1 | 3T Software Labs Gmbh | MongoDB GUI |