Введение. Программное обеспечение, предоставляемое производителями автоматических генетических анализаторов, в большинстве случаев позволяет провести адекватный анализ результатов секвенирования ДНК по Сэнгеру для матриц с составом нуклеотидов, близким к эквивалентному. Однако для рассмотрения результатов секвенирования матриц, отличающихся неэквивалентным нуклеотидным составом, требуется проводить анализ электрофореграмм с сохранением информации об интенсивности сигналов флуоресценции. В особенности это касается секвенирования ДНК, модифицированной бисульфитом натрия. Цель: разработать и апробировать в практике научных исследований компьютерную программу для обеспечения адекватного анализа электрофореграмм секвенирования ДНК по Сэнгеру на основе бережного отношения к первичным данным и аккуратного определения базовых линий в спектральных каналах отдельных нуклеотидов. Методы. Программа SeqBase написана на языке C#, программная платформа .NET Framework 4.0, и выполняется в среде исполнения CLR (Common Language Runtime) для операционных систем семейства Windows. Адрес установочного пакета программы SeqBase: http://www.epigenetic.ru/projects/seqbase. Результаты. Разработана компьютерная программа, предназначенная для анализа первичных результатов секвенирования по Сэнгеру (хроматограмм капиллярного электрофореза), полученных на автоматических генетических анализаторах и представленных в файлах формата ABIF (*.ab1), обеспечивающая следующие возможности: 1) просмотр исходных электрофореграмм как в общем виде, так и раздельно по спектральным каналам; 2) кадрирование области анализа; 3) сглаживание сигналов; 4) ручная установка базовой линии по каждому из спектральных каналов; 5) сведение базовых линий по всем каналам; 6) ручная коррекция подвижности фрагментов ДНК в зависимости от типа флуоресцентной метки терминирующего нуклеотида. Апробация программы успешно проведена в рамках ряда исследований, результаты которых опубликованы в рецензируемых научных изданиях. Заключение. Использование программы SeqBase целесообразно для анализа результатов секвенирования по Сэнгеру матриц ДНК с неэквивалентным нуклеотидным составом, в особенности, модифицированных бисульфитом натрия, во избежание получения ложных результатов и для уточнения количественных оценок.
Background. The software provided by the manufacturers of automatic genetic analyzers, in most cases, allows an adequate analysis of the results of Sanger DNA sequencing for templates with a nucleotide composition close to the equivalent. However, to consider the results of sequencing of templates with non-equivalent nucleotide composition, it is necessary to analyze electrophoregrams with preservation of primary information on the intensity of fluorescence signals. This is especially important for the sequencing of DNA modified with sodium bisulfite. Aim: to develop and validate in the practice of scientific research a computer program that ensures adequate analysis of electrophoregrams of Sanger DNA sequencing based on preservation of the primary data and on accurate determination of baselines in the spectral channels of individual nucleotides. Methods. The SeqBase program is written in C#, the programming platform .NET Framework 4.0, and runs in the CLR (Common Language Runtime) for Windows operating systems. SeqBase installation package address is http://www.epigenetic.ru/projects/seqbase. Results. A computer program has been developed designed to analyze the primary results of Sanger sequencing (chromatograms of capillary electrophoresis) obtained from automatic genetic analyzers and presented in files of the ABIF (*.ab1) format, which provides the following functions: 1) viewing the original electrophoregrams both in general form and separately by spectral channels; 2) cropping the area of analysis; 3) signal smoothing; 4) manual setting of the baseline for each of the spectral channels; 5) convergence of baselines on all channels; 6) manual correction of the mobility of DNA fragments depending on the type of fluorescent label of the terminating nucleotide. The program has been successfully tested in a number of studies, the results of which have been published in peer-reviewed scientific journals. Conclusion. The use of the SeqBase program is advisable for the analysis of the results of Sanger sequencing of DNA templates with non-equivalent nucleotide composition, especially those modified with sodium bisulfite, to avoid false results and to clarify quantitative estimates.