Comparison of Gene Classification Methods for Dengue Virus Type Based on Codon Usage

Panuwat Mekha Khukrit Osathanunkul Nutnicha Teeyasuksaet


การติดเชื้อไวรัสเด็งกีหรือโรคไข้เลือดออกมีสาเหตุจากเชื้อเด็งกีไวรัส ซึ่งเชื้อไวรัสสามารถถ่ายทอด
สู่มนุษย์โดยมียุงเป็นพาหะนำโรค เชื้อเด็งกีไวรัสแบ่งได้ 4 ซีโรไทป์ ตามประเภทผิวแอนติเจนแต่ละซีโรไทป์
ได้มีงานวิจัยหลายเรื่องที่ได้มกี ารตรวจสอบการจำแนกประเภทโมเลกุลของเชอื้ เด็งกีไวรัสออกเปน็ 4 กลุม่ หลัก
โดยใช้กระบวนการทางการเรียนรู้ด้วยเครื่องจักร รวมถึงใช้โคดอนยูสเอสเป็นตัวแยกคุณสมบัติ ในงานวิจัย
นี้ได้จำแนกประเภทโมเลกุลของเชื้อเด็งกีไวรัสด้วยข้อมูลสายลำดับ ทั้งนี้ได้เปรียบเทียบความถูกต้องในการ
จำแนกประเภทโมเลกุลของเชื้อเด็งกีไวรัสด้วยวิธีการต่างๆ จากสายลำดับโมเลกุลของเชื้อเด็งกีไวรัสที่นำมา
ทดสอบทั้งหมด 372 สาย และมีการวัดประสิทธิภาพของโมเดล แบบ 10-การตรวจสอบไขว้ ซึ่งวิธีการแบบ
นิวรอลเน็ตเวิร์ก ให้ผลความถูกต้องสูงสุดเท่ากับร้อยละ 96.22 ในการจำแนกประเภทโมเลกุลของเชื้อเด็งกีไวรัส

The Dengue virus infection or dengue fever is caused by the dengue virus (DENV).
It is transmitted to humans by mosquitoes. There are four serotypes classified together based on
their surface antigens. Each serotype can provide specific immunity and short-term cross-immunity in
human. Several studies have examined the classification of dengue molecules into four major
classes including methods such as machine learning using codon usage as features. In this work
we directly classify dengue molecules using their primary sequences. Thus, we have compared
different methods for data classification to classify sequences of dengue molecules. The method
was tested on 372 dengue sequences from the major classes. Using ten-fold cross-validation,
the neural network yields a prediction accuracy of 96.22% for classifying dengue classes.


Download data is not yet available.

