ISSN: 2471-9315
Prachi Singh
Der Erfolg des Humangenomprojekts hat zu einer Verbreitung von Genomsequenzierungsdaten geführt. Dies hat zusammen mit der Sequenzierung der nächsten Generation dazu beigetragen, die Kosten der Sequenzierung zu senken, was den Bedarf an der Analyse dieser großen Genomdaten weiter erhöht hat. Dieser Datensatz und seine Verarbeitung haben die medizinische Forschung unterstützt.
Daher benötigen wir Fachwissen, um mit biologischen Big Data umzugehen. Das Konzept des Cloud Computing und Big Data-Technologien wie das Apache Hadoop-Projekt sind hierbei erforderlich, um diese Daten zu speichern, zu verarbeiten und zu analysieren. Denn diese Technologien ermöglichen eine verteilte und parallelisierte Datenverarbeitung und sind effizient, um sogar Datensätze im Petabyte-Bereich (PB) zu analysieren. Es gibt jedoch auch einige Nachteile, darunter vor allem die Notwendigkeit einer längeren Datenübertragungszeit und eine geringere Netzwerkbandbreite.