最好看的2019中文大全在线观看,欧美最猛黑A片黑人猛交蜜桃视频,haodiaocao,午夜视频免费在线观看,91久久婷婷国产麻豆精品电影

RNA-seq數(shù)據(jù)分析

數(shù)據(jù)的統(tǒng)計分布

通過定量PCR測量的不同細胞之間同一基因的表單水平服從 對數(shù)正太分布

使用負二項分布作為它們對RNA-seq計數(shù)的建?;A 然而 很大部分值為零,導致很難用該分布擬合(白說了)

最新的論文認為可以用 Poisson-Twdddie family 建模? 對應的R包 tweeDESeq

重點工具:

推薦:DESeq 2

非參數(shù)方法 SAMSeq ,NOISeq

limma

歸一化

大多軟件在內部執(zhí)行歸一化

關于選擇差異表達分析的軟件包

決策樹如下

選擇要檢驗差異表達的特征的類型,用于:

差異表達的外顯子:DEXSeq

差異表達的異構體:BitSeq,Cuffdiff 或 ebSeq

差異表達的基因:選擇實驗設計的類型

復雜的設計(多因素):DESeq? edgeR? limma

組間的簡單比較:多少個生物學重復?

每個組超過5個生物學重復:SAMSeq

少于5個:DESeq? ?edgeR? ?limma

 

典型工作流程

1 fastq -> 質量控制和預處理? ->

2 比對到基因組 或 轉錄組

2.1? 比對到基因組 -> BAM? -> 讀段計數(shù) HTseq 、featureCounts 、 BEDTools等? -> 差異表達分析 DESeq edgeR? limma SAMSeq? DEXSeq 等

2.2? 比對到 轉錄組 -> BAM -> 基于異構體反褶積的差異表達分析? ? Cuffdiff 、BitSeq 、ebSeq等

 

 

火山圖

做火山圖使用差異倍數(shù) ford change 及 p值? ?代碼如下

def test():
    file_url = "e://生物信息//測試組學111-ABC transportor.xlsx"
    df = DataFrame(pd.read_excel(file_url , sheet_name="2",index_col="Gene_ID"))

    #預處理
    #data.mean(axis = 1)
    df.eval("""
        AD1_avg = (AD1_1 + AD1_2 + AD1_3 )/3
        AD3_avg = (AD3_1 + AD3_2 + AD3_3 )/3
        AD5_avg = (AD5_1 + AD5_2 + AD5_3 )/3
        CK1_avg = (CK1_1 + CK1_2 + CK1_3 )/3
        CK3_avg = (CK3_1 + CK3_2 + CK3_3 )/3
        CK5_avg = (CK5_1 + CK5_2 + CK5_3 )/3
        AD_avg = (AD1_avg + AD3_avg + AD5_avg) / 3
        CK_avg = (CK1_avg + CK3_avg + CK5_avg) / 3
        FoldChange = AD_avg / CK_avg
        """, inplace=True)

    df.to_excel("e://生物信息//Volcano.xlsx" , sheet_name="1")

    df2 = DataFrame(df,columns=["FoldChange"])

    # fold change 通常為了防止取log2時產生NA,給表達值加1 圖像中心向右移動到1
    df2 = np.log2(df2+1)

    # 和對照組 做t檢驗獲得p值
    a = df[['AD1_avg','AD3_avg','AD5_avg']]
    b = df[['CK1_avg','CK3_avg','CK5_avg']]
    t,p = stats.ttest_rel(a, b, axis=1) #按行配對

    df2.insert(loc=1,column='pvalue',value=p)
    df2['log(pvalue)'] = -np.log10(df2['pvalue'])

    #選定的差異基因標準是?I.差異倍數(shù)的絕對值大于1,II. 差異分析的P值小于0.05
    df2['sig'] = 'normal'
    df2['size'] = np.abs(df2['FoldChange']) / 10
    df2.loc[(df2.FoldChange > 1) & (df2.pvalue < 0.05), 'sig'] = 'up'
    df2.loc[(df2.FoldChange < -1) & (df2.pvalue < 0.05), 'sig'] = 'down'
    print(df2)
    df2.to_excel("e://生物信息//Volcano.xlsx", sheet_name="火山圖")
    ax = sns.scatterplot(x="FoldChange", y="log(pvalue)",
                         hue='sig',
                         hue_order=('down', 'normal', 'up'),
                         palette=("#377EB8", "grey", "#E41A1C"),
                         data=df2)
    ax.set_ylabel('-log(pvalue)', fontweight='bold')
    ax.set_xlabel('FoldChange', fontweight='bold')
    plt.show()

    #篩選差異基因
    fold = df2['FoldChange'].tolist()
    pvalue = df2['pvalue'].tolist()
    fold_cutoff = 1 #閾值
    pvalue_cutoff = 0.05 #顯著性

    filtered_ids = []
    for i in range(0, len(fold)):
        if (abs(fold[i]) >= fold_cutoff) and (pvalue[i] <= pvalue_cutoff):
            filtered_ids.append(i)

    filtered = df2.iloc[filtered_ids, :]
    print(filtered)
    print("Number of DE genes: ")
    print(len(filtered.index))

 

溫馨提示:當你和其他人給原創(chuàng)帖子點贊時,作者會得到報酬,如果你喜歡閱讀這里的內容,請立即創(chuàng)建你的聚生物賬戶,并開始為你的知識換取價值。

發(fā)表評論

国产+高潮+白浆+无码 | 欧美一级婬片A片免费软件 国产成人+ 8x8+高潮 | 精品国产乱码久久久久久1区2区-亚洲 | 老外添女人囗交做爰视频 | 国产高潮情侣一区二区 | 国产高清无码在线观看 | 无码一级毛片手机网站 | 黄色的网站在线免费观看 | 国产欧美综合一区二区三区 | 午夜无码人妻AⅤ大片大象传媒 | 四虎影成人A片免费播放 | 午夜剧场三级爱爱黑人 | 中文字幕在线观看一区 | 亚洲大胸人妻91av | 人妻日韩精品中文字幕 | 久久成人电影免费在线观看 | 69人妻偷拍 熟女丝 | 婷婷开心激情综合五月天 | 国产人妻 精品无码蜜汁 | 超碰在线国产swag | 91精品国产乱码久久久久久 | 午夜视频app在线观看 | 成人性做爰全过程免费 | 国产精品偷乱一区二区三区 | 国产美女永久免费无遮挡 | 高清无码国产在线观看 | _97夜夜澡人人爽人人 | 91午夜人妻熟女嗷嗷嗷 | 卡通欧美另类小说在线观看 | 亚洲三级视频在线观看 | 国产精品秘 ThePorn入口 | 国产又爽又粗又猛又色又 | 仙踪林国产成人抽搐精品 | 欧一美一交一乱一交免费看 | 狠狠躁爽A片免费观看 | 国产黄在线观看免费观看不卡 | 欧美嘼交ⅹⅹⅹ╳A片 | 专干老妇熟女6070频 | 国产乱人妻精品秘 入口 | 少妇搡BBBB搡BBB搡澳门 | 亚洲国产av日韩一区二区三区三州 |