Use of whole genome DNA spectrograms in bacterial classification

Loading...
Thumbnail Image
Date
2015-05-09
ORCID
Advisor
Referee
Mark
Journal Title
Journal ISSN
Volume Title
Publisher
Elsevier
Altmetrics
Abstract
A spectrogram reflects the arrangement of nucleotides through the whole chromosome or genome. Our previous study suggested that the spectrogram of whole genome DNA sequences is a suitable tool for the determination of relationships among bacteria. Related bacteria have similar spectrograms, and similarity in spectrograms was measured using a color layout descriptor. Several parameters, such as the mapping of four bases into a spectrogram, the number of considered elements in the color layout descriptor, the color model of the image and the building tree method, can be changed. This study addresses the use of parameter selection to ensure the best classification results. The quality of the classification was measured by Matthew’s correlation coefficient (MCC). The proposed method with optimal parameters (called SpectCMP—Spectrogram CoMParison method) achieved an average MCC of 0.73 at the phylum level. The SpectCMP method was also tested at the order level; the average MCC in the classification of class Gammaproteobacteria was 0.76. The success of a classification with respect to the correct phyla was compared to three methods that are used in bacterial phylogeny: the CVTree method, OGTree method and moment vector method. The results show that the SpectCMP method can be used in bacterial classification at various taxonomic levels.
Spektrogram odráží uspořádání nukleotidů v chromosomu nebo genomu. Naše předchozí studie naznačují, že spektrogram celogenómové DNA sekvence, je vhodným nástrojem pro stanovení vztahů mezi bakterií. Související bakterie mají podobné spektrogramy, a podobnost spektrogramu byla měřena pomocí deskriptoru (CLD). Několik parametrů, jako je například mapování čtyř bází do spektrogram, počet uvažovaných prvků v deskriptoru, barevný model obrazu a způsob vypočítání stromu, lze změnit. Tato studie se zaměřuje na nastavení parametrů pro nejlepší výsledky klasifikace. Kvalita klasifikace byla měřena pomocí Matthewova korelačního koeficientu (MCC). Navržená metoda s optimálními parametry (tzv SpectCMP-Metoda porovnávací pektrogramy), dosáhla průměrného MCC 0.73 na úrovni kmenu. Metoda SpectCMP byla také testována na úrovni tříd; průměrná MCC v klasifikaci třídy Gammaproteobacteria byl 0,76. Úspěch klasifikace byl porovnán s třemi metody, které se používají v bakteriální fylegenetice: Metoda CVTree, metoda OGTree metoda momentu vektoru. Výsledky ukazují, že SpectCMP metoda může být použita v bakteriální klasifikaci na různých taxonomických úrovních.
Description
Citation
COMPUTERS IN BIOLOGY AND MEDICINE. 2015, vol. 69, issue February 2016, p. 298-307.
https://www.sciencedirect.com/science/article/pii/S0010482515001675
Document type
Peer-reviewed
Document version
Published version
Date of access to the full text
Language of document
en
Study field
Comittee
Date of acceptance
Defence
Result of defence
Document licence
Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International
http://creativecommons.org/licenses/by-nc-nd/4.0/
Citace PRO