Dựa trên paper Robust feature learning using contractive autoencoders for multi-omics clustering in cancer subtyping
dataset: DNA methylation 450K và RNAseq FPKM Xena
-
Dữ liệu DNA methylation được bỏ đi các feature bị thiếu hơn 20% giá trị, sau đó fill các ô bị thiếu giá trị bằng phương pháp tính mean của các sample khác.
-
Tính điểm trên các feature dựa trên công thức:
-
Từ điểm số chọn các feature có điểm số cao nhất của từng loại omic (DNA methyaltion 1000 feature, RNAseq 2000 feature).
