引用本文: 奥伟, 殷德涛. 运用生物信息学筛选甲状腺乳头状癌生物靶点. 中国普外基础与临床杂志, 2021, 28(3): 329-335. doi: 10.7507/1007-9424.202006044 复制
甲状腺癌(TC)是最常见的头颈部恶性肿瘤之一[1],其中最常见的类型是甲状腺乳头状癌(papillary thyroid carcinoma,PTC),占所有 TC 病例的 70%~80%[2]。目前,PTC 的病因尚不十分清楚,认为其可能与电离辐射、碘摄取异常、促甲状腺激素(TSH)慢性刺激、雌激素异常、肥胖等有关[3]。早期 PTC 的临床表现不甚明显,仅有彩色多普勒检查提示颈部包块或结节等征象。另一方面,不可否认的是,尽管 PTC 有着惰性的生物学特征,在日渐规范的手术切除术式及放射性碘(radioactive iodine,RAI)治疗后大部分患者预后良好,但仍然呈现出部分患者有较大的原发灶、淋巴结转移及全身骨转移的特征[4],行肿瘤姑息手术后的患者若不能摄取放射性碘或放射性碘摄取差,则其放射性碘治疗效果极差,甚至影响生存寿命。
随着基因组学及转录组学的快速发展,各项研究技术被运用于分子生物学领域,其中高通量基因表达测序技术凭借规模大、样本需求量小、测序时间短、准确等特点,帮助国内外科研人员获得了海量研究数据。基于技术的革新与数据共享时代的来临,人们对 TC 发生发展的分子机制的研究越加深入,一系列的分子靶向药物随之而来,如索拉非尼等。与此同时,新的问题随之产生,大多数肿瘤的发生发展与基因突变密切相关,往往涉及不止一个药物作用靶点,因此单一作用靶点的靶向治疗很难达到根治的目的;而且随着治疗时间的延长,肿瘤细胞可能发生新的基因突变型,产生相应的耐药机制,比如 Herceptin(郝赛汀),是一种广泛用于治疗 HER2 阳性乳腺癌患者的单抗靶向药物,但有 50% 以上的乳腺癌患者在用药 1 年内对其治疗产生耐药[5]。因此进一步了解 PTC 发生发展的生物分子机制,寻找新的临床病理特征判断依据及预后评价、靶向治疗的新分子靶点,显得尤为重要。
1 资料与方法
1.1 微阵列数据
在基因表达综合数据库(GEO,Affymetrix GPL570 平台,Affymetrix GPL13607 平台)选取了 3 个基因表达数据集(GSE3467、GSE33630 和 GSE50901),只筛选了其中符合条件(PTC)的样本数据。根据平台中的注释信息,将探针转换为相应的基因符号。GSE3467 数据集包含 9 个 PTC 组织样本和 9 个非癌性样本;GSE33630 包含 49 个 PTC 样本和 45 个非癌性样本;GSE50901 包含 61 个 PTC 样本和 13 个非癌性样本。
1.2 差异表达基因(the differentially expressed genes,DEGs)的筛选
使用 GEO2R 筛选 PTC 和非癌性样本之间的 DEGs。由于生信信息学分析假阳性率较高,通过校正后的 P 值以及 Benjamini-Hochberg 法计算得到的错误发现率(false discover rate,FDR)在统计学意义上显著的基因发现与假阳性限制之间取得平衡。以|logFC(fold change)|>1 且校正后的 P 值<0.01 被认为具有统计学意义。
1.3 DEGs 的 KEGG 和 GO 富集分析
为了分析 DEGs 的功能,使用 DAVID 在线数据库对 DEGs 进行了 KEGG 和 GO 富集分析。P<0.05 被认为具有统计学意义。
1.4 蛋白互作(PPI)网络构建和分析
在本研究中,使用在线数据库(STRING,
1.5 关键基因的分析
本研究通过下载 TCGA 数据库中 TC 的 mRNA 表达谱,只选取 PTC 类型的样本,然后用 R 计算数据集中每个关键基因与其他所有基因的皮尔逊相关系数(Pearson correlation coefficient),以其绝对值大于 0.8 为标准筛选关键基因相关的共表达基因。然后将其与关键基因利用 STRING 在线数据库绘制出关键基因及其共表达基因相关的基因互作网络图。无复发生存期(recurrence-free-survival,RFS):从初次手术当日到首次区域或远处淋巴结转移复发的时间间隔,或发生对侧新发癌灶或至病患死亡。利用 R 的 survminer 包根据关键基因的表达量进行分组,然后分析其与 RFS 的关系。使用 Benjaminiand-Hochberg 法对得到的假设检验 P 值做多重检验校正。使用 UCSC 癌症基因组学浏览器(
2 结果
2.1 DEGs 的筛选结果
在 3 个基因表达数据集分别筛选出 DEGs:GSE3467 中 654 个,GSE33630 中 1 238 个和 GSE50901 中 1 211 个。3 个数据集所有差异基因之间的重叠包含 339 个基因,如 Venn 图(图 1a)所示,包括 189 个上调基因和 150 个下调的 PTC 组织和非肿瘤组织之间的基因。

a:Venn 图,以|logFC|>1 且校正后的
2.2 DEGs 的 KEGG 和 GO 富集分析结果
为了对 DEGs 进行生物学分类分析,使用 DAVID 对其进行了功能和途径富集分析。其中 GO 分析结果表明,上调的 DEGs 的生物学过程的改变明显富集在细胞外基质降解、血管生成、MAPK 信号通路相关酶的活性和细胞间及细胞对胞外成分的反应;而下调的 DEGs 主要参与的生物学过程是在甲状腺激素等激素的生物合成、RAS 信号通路的限制酶的活性、离子稳态的调节及细胞转录的调控。KEGG 途径分析结果表明,上调的 DEGs 主要涉及的生物学通路为补体和凝血级联反应过程、涉及细胞对胞外成分的反应的细胞外基质(ECM) 受体相互作用、磷脂酰肌醇 3-激酶/V-AKT 小鼠胸腺瘤病毒同源癌基因(PI3K-Akt)信号通路及其下游的 p53 信号通路,下调的 DEGs 主要参与的生物学通路为甲状腺激素的合成、酪氨酸代谢、矿物吸收等(表 1)。

2.3 PPI 网络构建和分析结果
构建 DEGs 的 PPI 网络(图 1b),使用 Cytoscape 获得了最重要的子模块(图 1c)并筛选出了 10 个关键基因,即纤维连接蛋白 1(FN1)、细胞周期蛋白 D1(CCND1)、金属肽酶抑制剂 1(TIMP1)、细胞间黏附分子 1(ICAM1)、载脂蛋白E (APOE)、MET(原癌基因 MET,酪氨酸激酶受体)、RUNX 家族转录因子 2(RUNX2)、角蛋白 19(KRT19)、KIT(原癌基因 KIT,酪氨酸蛋白激酶)和丝氨酸蛋白酶抑制蛋白家族 A 成员 1(SERPINA1),并对 DEGs 进行了基因富集的 GO 条目的分析以及可视化(图 1d)。
2.4 关键基因相互作用网络及功能分析结果
利用 STRING 在线数据库绘制出 10 个关键基因及其共表达基因相关的基因互作网络图(图 1e)。随后通过 R 分析这 10 个关键基因与 RFS 的关系(图 2a-2j),然后再使用 Benjaminiand-Hochberg 法对得到的假设检验 P 值做多重检验校正,可得 APOE(FDR=0.047 5)以及 KIT(FDR=0.042 0)基因表达的改变对 PTC 患者的 RFS 有一定的影响,具有统计学意义。同时使用 UCSC 癌症基因组学浏览器(

a–j:分别表示 10 个关键基因表达水平与 RFS 的关系,
3 讨论
本研究一共筛选出 339 个 PTC 和正常甲状腺组织差异表达基因,包括 189 个上调基因和 150 个下调的 PTC 组织和非肿瘤组织之间的基因。GO 分析结果表明,上调的 DEGs 的生物学过程的改变明显富集在细胞外基质降解、血管生成、MAPK 信号通路相关酶的活性和细胞间及细胞对胞外成分的反应。而下调的 DEGs 主要参与的生物学过程在甲状腺激素的生物合成、RAS 信号通路的限制酶的活性、离子稳态的调节及细胞转录的调控。KEGG 途径分析结果表明,上调的 DEGs 主要涉及的生物学通路为补体和凝血级联反应过程、涉及细胞对胞外成分的反应的 ECM 受体相互作用、PI3K-Akt 信号通路及其下游的 p53 信号通路,下调的 DEGs 主要参与的生物学通路为甲状腺激素的合成、酪氨酸代谢、矿物吸收等。而细胞外基质成分的降解通过激活不同的细胞信号通路,加快了肿瘤细胞的转化和转移过程[6]。其中细胞间及细胞与细胞外基质的相互作用可能涉及整合素结合、ECM 受体相互作用、细胞黏附等生物学途径及 Notch 信号通路。此外,PTC 的发生发展可能与雌激素异常相关。分化良好的 TC,女性患者明显多于男性患者。实验证实,雌激素受体(ER)确实存在于 TC 组织中[7]。在细胞免疫调节、增殖、分化等过程中,白细胞介素(Interleukin,IL)发挥了重要作用,这与 PTC 的发生发展密切相关[8-9]。另外,本研究发现机体炎症反应中的补体激活也可能参与到了癌症的发生发展中。
PTC 的分子遗传学研究目前主要集中在与肿瘤发生发展密切相关的信号通路上。信号通路是指分子信号介导胞外与细胞相互作用,引发细胞内一系列酶促级联反应的通路。目前,丝裂原激活的蛋白激酶(mitogen-activated protein kinase,MAPK)信号通路与磷脂酰肌醇 3-激酶/V-AKT、PI3K-Akt 信号通路已被证明与 PTC 发生发展密切相关[10]。MAPK 信号通路主要涉及 BRAF 基因、RAS 基因、ALK 基因、MEK 基因、ERK 基因等。当细胞外的刺激信号结合相应的细胞表面受体时,可激活受体细胞内部分蛋白激酶发挥功能,进而激活 RAS 基因,随之激活 BREF 基因,继续活化下游的 MEK 基因和 ERK 基因[11]。这与本研究差异基因 GO 分析出的 ERK1 和 ERK2 级联调节、RPTK-Ras 信号通路等相一致。另外,ALK 可能通过引起 BRAF 激酶结构域异常表达影响该通路。在 PI3K-Akt 信号通路中,Akt 有多种方式磷酸化激活下游靶蛋白。一方面可活化 IκB 激酶,该激酶能够降解核因子 NF-κB 的抑制剂 IκB,有证据表明核因子 NF-κB 通路也与甲状腺癌的发生发展密切相关。另一方面,AKT 可通过抑制蛋白水解酶 Caspase-9 的激活阻止凋亡级联反应发生。此外,肿瘤抑制因子 p53 为一介导内源性凋亡信号通路的转录因子。AKT 可磷酸化 p53 的结合蛋白 MDM2,进而使其转位到细胞核中,结合 p53,促进其降解,影响细胞存活。此外对于 PTC,果蝇 WNT 同源基因/β-连锁蛋白(Wnt/β-catenin)通路、转化生长因子 β(TGF-β)通路以及 Notch 信号通路等也有重要意义。
构建 PPI 网络图后筛选出 10 个基因,即 FN1、CCND1、TIMP1、ICAM1、APOE、MET、RUNX2、KRT19、KIT 和 SERPINA1。
FN1 与肿瘤的发生发展密切相关,但在肿瘤中的功能却存在争议。一方面,FN1 可通过结合整合素,以 FAK、RAS 等途径促进 MMP2/MMP9 的表达,从而促进卵巢癌和乳腺癌的生长、侵袭和转移[12-13]。相关研究[14]表明,人表皮生长因子受体 2(HER2)可以通过 MEK 及 ERK 通路诱导 FN1 的表达,增加乳腺癌的迁移和侵袭能力。该途径与 PTC 发生发展密切相关,提示 FN1 可能作为 PTC 靶向治疗的新靶点。另一方面,FN1 又作为一个抑癌基因的角色出现在胃癌和结直肠癌肿瘤组织中。
CCND1 是细胞周期蛋白的重要成员之一,既往实验表明其与 PTC 的恶性细胞增殖密切相关,与 PTC 淋巴结转移无明显关联性[15],但也有研究[16]发现,CCND1 的阳性表达等因素是 PTC 出现淋巴结转移和预后较差的危险因子,有待进一步研究。
TIMP1,相关研究[17]表明,TIMP1 作为关键靶基因,参与 MMPs 的转录后调控。主要通过与 MMPs 蛋白结合,降低其表达能力,这对 PTC 细胞迁移和侵袭的能力起到重要作用。
ICAM1,实验[18]表明,一方面 ICAM-1 的上调与肿瘤的侵袭性特征如 BRAFV600E突变、ETE 和淋巴结转移相关,其表达随着肿瘤恶性程度的增高而增强,这提示 ICAM-1 在 PTC 的进展中起作用,且可作为判定肿瘤侵袭的指标之一。另一方面,相关实验[19]表明, ICAM-1 仅在 PTC 中高表达,在甲状腺滤泡状癌、滤泡状腺瘤和腺瘤样甲状腺肿中无表达,这有助于乳头状癌和滤泡状癌两种甲状腺恶性肿瘤的鉴别诊断。
MET,Ramirez 等[20]用免疫组化方法证实分化型甲状腺癌 C-MET 蛋白表达水平明显高于甲状腺良性肿瘤及正常组织。此外相关研究[21]表明,C-MET 蛋白表达强度与 PTC 转移风险有关,体现在 C-MET 蛋白强表达组多合并有颈部淋巴结转移,且癌灶突破包膜和周围组织侵犯比例高。这些证据提示 MET 基因为临床预后提供了一个良好的参考标准。
RUNX2,龚婷等[22]研究发现,RUNX2 在 PTC 中的表达水平的高低与肿瘤大小密切相关,在较大的癌灶中表达较高。RUNX2 可能与 PTC 内钙化灶的产生及癌的发生发展有关,在其他的恶性肿瘤(如乳腺癌、前列腺癌、骨肉瘤)也有相关研究。此外,有研究[23]表明 RUNX2 是 miR-218 的直接靶标,可通过抑制其表达,抑制体内肿瘤生长,阻断 PTEN-PI3K-Akt 途径。
KRT19,在多种肿瘤发生发展中起重要作用,但在 PTC 中的作用尚不清楚。Wang 等[24]研究表明,KRT19 的表达仅在含有 B-Raf 原癌基因、丝氨酸/苏氨酸激酶(BRAF)V600E 突变和 BRAFV600E过表达的肿瘤中增加。进而推测 BRAFV600E诱导的 KRT19 表达可能通过促进上皮间质转化(EMT)促进 PTC 的转移。
KIT 作为细胞因子 KITLG/SCF 的细胞表面受体,可激活多种信号通路,对调节细胞存活和增殖、细胞迁移等起重要作用。相关研究[25]表明,以该基因为靶点通过尿微生物可用于诊断乳腺癌,这意味着该基因可能作为新的 PTC 治疗靶点。
SERPINA1,相关文献[26]表明该基因可作为筛选 PTC 的靶点,准确区分 PTC 和良性结节。
APOE(载脂蛋白 E)是血浆脂蛋白的核心成分,参与其产生、转化和清除,并在肿瘤微环境中诱导炎症免疫反应。相关研究[27]表明其可作为评估非小细胞肺癌(NSCLC)淋巴结转移的有效指标。此外,研究[28]发现在前列腺增生与前列腺癌之间,载脂蛋白E差异显著。这意味着其可能是一种潜在的某些癌症的生物标记物。
综上,本研究旨在寻找 PTC 新的临床病理特征判断依据以及预后评价和靶向治疗的新分子靶点,共筛选出 339 个 DEGs 及 10 个关键基因。但仍需要进一步的研究来具体阐明这些基因在 PTC 发生发展过程中的生物作用机制。
重要声明
利益冲突声明:作者声明,该研究工作没有利益冲突。
作者贡献声明:奥伟参与数据整理、分析、方法论、验证及撰写初稿;殷德涛参与概念化、监督和写作审查和编辑。
甲状腺癌(TC)是最常见的头颈部恶性肿瘤之一[1],其中最常见的类型是甲状腺乳头状癌(papillary thyroid carcinoma,PTC),占所有 TC 病例的 70%~80%[2]。目前,PTC 的病因尚不十分清楚,认为其可能与电离辐射、碘摄取异常、促甲状腺激素(TSH)慢性刺激、雌激素异常、肥胖等有关[3]。早期 PTC 的临床表现不甚明显,仅有彩色多普勒检查提示颈部包块或结节等征象。另一方面,不可否认的是,尽管 PTC 有着惰性的生物学特征,在日渐规范的手术切除术式及放射性碘(radioactive iodine,RAI)治疗后大部分患者预后良好,但仍然呈现出部分患者有较大的原发灶、淋巴结转移及全身骨转移的特征[4],行肿瘤姑息手术后的患者若不能摄取放射性碘或放射性碘摄取差,则其放射性碘治疗效果极差,甚至影响生存寿命。
随着基因组学及转录组学的快速发展,各项研究技术被运用于分子生物学领域,其中高通量基因表达测序技术凭借规模大、样本需求量小、测序时间短、准确等特点,帮助国内外科研人员获得了海量研究数据。基于技术的革新与数据共享时代的来临,人们对 TC 发生发展的分子机制的研究越加深入,一系列的分子靶向药物随之而来,如索拉非尼等。与此同时,新的问题随之产生,大多数肿瘤的发生发展与基因突变密切相关,往往涉及不止一个药物作用靶点,因此单一作用靶点的靶向治疗很难达到根治的目的;而且随着治疗时间的延长,肿瘤细胞可能发生新的基因突变型,产生相应的耐药机制,比如 Herceptin(郝赛汀),是一种广泛用于治疗 HER2 阳性乳腺癌患者的单抗靶向药物,但有 50% 以上的乳腺癌患者在用药 1 年内对其治疗产生耐药[5]。因此进一步了解 PTC 发生发展的生物分子机制,寻找新的临床病理特征判断依据及预后评价、靶向治疗的新分子靶点,显得尤为重要。
1 资料与方法
1.1 微阵列数据
在基因表达综合数据库(GEO,Affymetrix GPL570 平台,Affymetrix GPL13607 平台)选取了 3 个基因表达数据集(GSE3467、GSE33630 和 GSE50901),只筛选了其中符合条件(PTC)的样本数据。根据平台中的注释信息,将探针转换为相应的基因符号。GSE3467 数据集包含 9 个 PTC 组织样本和 9 个非癌性样本;GSE33630 包含 49 个 PTC 样本和 45 个非癌性样本;GSE50901 包含 61 个 PTC 样本和 13 个非癌性样本。
1.2 差异表达基因(the differentially expressed genes,DEGs)的筛选
使用 GEO2R 筛选 PTC 和非癌性样本之间的 DEGs。由于生信信息学分析假阳性率较高,通过校正后的 P 值以及 Benjamini-Hochberg 法计算得到的错误发现率(false discover rate,FDR)在统计学意义上显著的基因发现与假阳性限制之间取得平衡。以|logFC(fold change)|>1 且校正后的 P 值<0.01 被认为具有统计学意义。
1.3 DEGs 的 KEGG 和 GO 富集分析
为了分析 DEGs 的功能,使用 DAVID 在线数据库对 DEGs 进行了 KEGG 和 GO 富集分析。P<0.05 被认为具有统计学意义。
1.4 蛋白互作(PPI)网络构建和分析
在本研究中,使用在线数据库(STRING,
1.5 关键基因的分析
本研究通过下载 TCGA 数据库中 TC 的 mRNA 表达谱,只选取 PTC 类型的样本,然后用 R 计算数据集中每个关键基因与其他所有基因的皮尔逊相关系数(Pearson correlation coefficient),以其绝对值大于 0.8 为标准筛选关键基因相关的共表达基因。然后将其与关键基因利用 STRING 在线数据库绘制出关键基因及其共表达基因相关的基因互作网络图。无复发生存期(recurrence-free-survival,RFS):从初次手术当日到首次区域或远处淋巴结转移复发的时间间隔,或发生对侧新发癌灶或至病患死亡。利用 R 的 survminer 包根据关键基因的表达量进行分组,然后分析其与 RFS 的关系。使用 Benjaminiand-Hochberg 法对得到的假设检验 P 值做多重检验校正。使用 UCSC 癌症基因组学浏览器(
2 结果
2.1 DEGs 的筛选结果
在 3 个基因表达数据集分别筛选出 DEGs:GSE3467 中 654 个,GSE33630 中 1 238 个和 GSE50901 中 1 211 个。3 个数据集所有差异基因之间的重叠包含 339 个基因,如 Venn 图(图 1a)所示,包括 189 个上调基因和 150 个下调的 PTC 组织和非肿瘤组织之间的基因。

a:Venn 图,以|logFC|>1 且校正后的
2.2 DEGs 的 KEGG 和 GO 富集分析结果
为了对 DEGs 进行生物学分类分析,使用 DAVID 对其进行了功能和途径富集分析。其中 GO 分析结果表明,上调的 DEGs 的生物学过程的改变明显富集在细胞外基质降解、血管生成、MAPK 信号通路相关酶的活性和细胞间及细胞对胞外成分的反应;而下调的 DEGs 主要参与的生物学过程是在甲状腺激素等激素的生物合成、RAS 信号通路的限制酶的活性、离子稳态的调节及细胞转录的调控。KEGG 途径分析结果表明,上调的 DEGs 主要涉及的生物学通路为补体和凝血级联反应过程、涉及细胞对胞外成分的反应的细胞外基质(ECM) 受体相互作用、磷脂酰肌醇 3-激酶/V-AKT 小鼠胸腺瘤病毒同源癌基因(PI3K-Akt)信号通路及其下游的 p53 信号通路,下调的 DEGs 主要参与的生物学通路为甲状腺激素的合成、酪氨酸代谢、矿物吸收等(表 1)。

2.3 PPI 网络构建和分析结果
构建 DEGs 的 PPI 网络(图 1b),使用 Cytoscape 获得了最重要的子模块(图 1c)并筛选出了 10 个关键基因,即纤维连接蛋白 1(FN1)、细胞周期蛋白 D1(CCND1)、金属肽酶抑制剂 1(TIMP1)、细胞间黏附分子 1(ICAM1)、载脂蛋白E (APOE)、MET(原癌基因 MET,酪氨酸激酶受体)、RUNX 家族转录因子 2(RUNX2)、角蛋白 19(KRT19)、KIT(原癌基因 KIT,酪氨酸蛋白激酶)和丝氨酸蛋白酶抑制蛋白家族 A 成员 1(SERPINA1),并对 DEGs 进行了基因富集的 GO 条目的分析以及可视化(图 1d)。
2.4 关键基因相互作用网络及功能分析结果
利用 STRING 在线数据库绘制出 10 个关键基因及其共表达基因相关的基因互作网络图(图 1e)。随后通过 R 分析这 10 个关键基因与 RFS 的关系(图 2a-2j),然后再使用 Benjaminiand-Hochberg 法对得到的假设检验 P 值做多重检验校正,可得 APOE(FDR=0.047 5)以及 KIT(FDR=0.042 0)基因表达的改变对 PTC 患者的 RFS 有一定的影响,具有统计学意义。同时使用 UCSC 癌症基因组学浏览器(

a–j:分别表示 10 个关键基因表达水平与 RFS 的关系,
3 讨论
本研究一共筛选出 339 个 PTC 和正常甲状腺组织差异表达基因,包括 189 个上调基因和 150 个下调的 PTC 组织和非肿瘤组织之间的基因。GO 分析结果表明,上调的 DEGs 的生物学过程的改变明显富集在细胞外基质降解、血管生成、MAPK 信号通路相关酶的活性和细胞间及细胞对胞外成分的反应。而下调的 DEGs 主要参与的生物学过程在甲状腺激素的生物合成、RAS 信号通路的限制酶的活性、离子稳态的调节及细胞转录的调控。KEGG 途径分析结果表明,上调的 DEGs 主要涉及的生物学通路为补体和凝血级联反应过程、涉及细胞对胞外成分的反应的 ECM 受体相互作用、PI3K-Akt 信号通路及其下游的 p53 信号通路,下调的 DEGs 主要参与的生物学通路为甲状腺激素的合成、酪氨酸代谢、矿物吸收等。而细胞外基质成分的降解通过激活不同的细胞信号通路,加快了肿瘤细胞的转化和转移过程[6]。其中细胞间及细胞与细胞外基质的相互作用可能涉及整合素结合、ECM 受体相互作用、细胞黏附等生物学途径及 Notch 信号通路。此外,PTC 的发生发展可能与雌激素异常相关。分化良好的 TC,女性患者明显多于男性患者。实验证实,雌激素受体(ER)确实存在于 TC 组织中[7]。在细胞免疫调节、增殖、分化等过程中,白细胞介素(Interleukin,IL)发挥了重要作用,这与 PTC 的发生发展密切相关[8-9]。另外,本研究发现机体炎症反应中的补体激活也可能参与到了癌症的发生发展中。
PTC 的分子遗传学研究目前主要集中在与肿瘤发生发展密切相关的信号通路上。信号通路是指分子信号介导胞外与细胞相互作用,引发细胞内一系列酶促级联反应的通路。目前,丝裂原激活的蛋白激酶(mitogen-activated protein kinase,MAPK)信号通路与磷脂酰肌醇 3-激酶/V-AKT、PI3K-Akt 信号通路已被证明与 PTC 发生发展密切相关[10]。MAPK 信号通路主要涉及 BRAF 基因、RAS 基因、ALK 基因、MEK 基因、ERK 基因等。当细胞外的刺激信号结合相应的细胞表面受体时,可激活受体细胞内部分蛋白激酶发挥功能,进而激活 RAS 基因,随之激活 BREF 基因,继续活化下游的 MEK 基因和 ERK 基因[11]。这与本研究差异基因 GO 分析出的 ERK1 和 ERK2 级联调节、RPTK-Ras 信号通路等相一致。另外,ALK 可能通过引起 BRAF 激酶结构域异常表达影响该通路。在 PI3K-Akt 信号通路中,Akt 有多种方式磷酸化激活下游靶蛋白。一方面可活化 IκB 激酶,该激酶能够降解核因子 NF-κB 的抑制剂 IκB,有证据表明核因子 NF-κB 通路也与甲状腺癌的发生发展密切相关。另一方面,AKT 可通过抑制蛋白水解酶 Caspase-9 的激活阻止凋亡级联反应发生。此外,肿瘤抑制因子 p53 为一介导内源性凋亡信号通路的转录因子。AKT 可磷酸化 p53 的结合蛋白 MDM2,进而使其转位到细胞核中,结合 p53,促进其降解,影响细胞存活。此外对于 PTC,果蝇 WNT 同源基因/β-连锁蛋白(Wnt/β-catenin)通路、转化生长因子 β(TGF-β)通路以及 Notch 信号通路等也有重要意义。
构建 PPI 网络图后筛选出 10 个基因,即 FN1、CCND1、TIMP1、ICAM1、APOE、MET、RUNX2、KRT19、KIT 和 SERPINA1。
FN1 与肿瘤的发生发展密切相关,但在肿瘤中的功能却存在争议。一方面,FN1 可通过结合整合素,以 FAK、RAS 等途径促进 MMP2/MMP9 的表达,从而促进卵巢癌和乳腺癌的生长、侵袭和转移[12-13]。相关研究[14]表明,人表皮生长因子受体 2(HER2)可以通过 MEK 及 ERK 通路诱导 FN1 的表达,增加乳腺癌的迁移和侵袭能力。该途径与 PTC 发生发展密切相关,提示 FN1 可能作为 PTC 靶向治疗的新靶点。另一方面,FN1 又作为一个抑癌基因的角色出现在胃癌和结直肠癌肿瘤组织中。
CCND1 是细胞周期蛋白的重要成员之一,既往实验表明其与 PTC 的恶性细胞增殖密切相关,与 PTC 淋巴结转移无明显关联性[15],但也有研究[16]发现,CCND1 的阳性表达等因素是 PTC 出现淋巴结转移和预后较差的危险因子,有待进一步研究。
TIMP1,相关研究[17]表明,TIMP1 作为关键靶基因,参与 MMPs 的转录后调控。主要通过与 MMPs 蛋白结合,降低其表达能力,这对 PTC 细胞迁移和侵袭的能力起到重要作用。
ICAM1,实验[18]表明,一方面 ICAM-1 的上调与肿瘤的侵袭性特征如 BRAFV600E突变、ETE 和淋巴结转移相关,其表达随着肿瘤恶性程度的增高而增强,这提示 ICAM-1 在 PTC 的进展中起作用,且可作为判定肿瘤侵袭的指标之一。另一方面,相关实验[19]表明, ICAM-1 仅在 PTC 中高表达,在甲状腺滤泡状癌、滤泡状腺瘤和腺瘤样甲状腺肿中无表达,这有助于乳头状癌和滤泡状癌两种甲状腺恶性肿瘤的鉴别诊断。
MET,Ramirez 等[20]用免疫组化方法证实分化型甲状腺癌 C-MET 蛋白表达水平明显高于甲状腺良性肿瘤及正常组织。此外相关研究[21]表明,C-MET 蛋白表达强度与 PTC 转移风险有关,体现在 C-MET 蛋白强表达组多合并有颈部淋巴结转移,且癌灶突破包膜和周围组织侵犯比例高。这些证据提示 MET 基因为临床预后提供了一个良好的参考标准。
RUNX2,龚婷等[22]研究发现,RUNX2 在 PTC 中的表达水平的高低与肿瘤大小密切相关,在较大的癌灶中表达较高。RUNX2 可能与 PTC 内钙化灶的产生及癌的发生发展有关,在其他的恶性肿瘤(如乳腺癌、前列腺癌、骨肉瘤)也有相关研究。此外,有研究[23]表明 RUNX2 是 miR-218 的直接靶标,可通过抑制其表达,抑制体内肿瘤生长,阻断 PTEN-PI3K-Akt 途径。
KRT19,在多种肿瘤发生发展中起重要作用,但在 PTC 中的作用尚不清楚。Wang 等[24]研究表明,KRT19 的表达仅在含有 B-Raf 原癌基因、丝氨酸/苏氨酸激酶(BRAF)V600E 突变和 BRAFV600E过表达的肿瘤中增加。进而推测 BRAFV600E诱导的 KRT19 表达可能通过促进上皮间质转化(EMT)促进 PTC 的转移。
KIT 作为细胞因子 KITLG/SCF 的细胞表面受体,可激活多种信号通路,对调节细胞存活和增殖、细胞迁移等起重要作用。相关研究[25]表明,以该基因为靶点通过尿微生物可用于诊断乳腺癌,这意味着该基因可能作为新的 PTC 治疗靶点。
SERPINA1,相关文献[26]表明该基因可作为筛选 PTC 的靶点,准确区分 PTC 和良性结节。
APOE(载脂蛋白 E)是血浆脂蛋白的核心成分,参与其产生、转化和清除,并在肿瘤微环境中诱导炎症免疫反应。相关研究[27]表明其可作为评估非小细胞肺癌(NSCLC)淋巴结转移的有效指标。此外,研究[28]发现在前列腺增生与前列腺癌之间,载脂蛋白E差异显著。这意味着其可能是一种潜在的某些癌症的生物标记物。
综上,本研究旨在寻找 PTC 新的临床病理特征判断依据以及预后评价和靶向治疗的新分子靶点,共筛选出 339 个 DEGs 及 10 个关键基因。但仍需要进一步的研究来具体阐明这些基因在 PTC 发生发展过程中的生物作用机制。
重要声明
利益冲突声明:作者声明,该研究工作没有利益冲突。
作者贡献声明:奥伟参与数据整理、分析、方法论、验证及撰写初稿;殷德涛参与概念化、监督和写作审查和编辑。