了解蛋白质-蛋白质相互作用对于基础研究以及各种生物医学和其他实际应用是重要的。这种的实例包括肽片段或表位与抗体之间的结合、蛋白质与其他蛋白质的短片段(例如MDM2和p53反式激活结构域、Bcl-xL和Bak肽)之间的相互作用、以及被称为适体的肽与其靶蛋白之间的结合。鉴定蛋白质的肽结合剂的简单可靠方法的开发帮助了解蛋白质-蛋白质相互作用的机制,并且为药物开发开辟了新的机会。
现有技术的计算机模拟的肽发现由X射线晶体结构指导,并且依赖现有的结构信息。这种方法对肽结合剂的从头发现的应用是有限的。迄今为止,实验方法提供了用于肽发现的最有效方法。鉴定蛋白质的结合剂的一种方法是依赖组合肽文库的展示技术,其中肽与编码其的DNA或RNA分子连接。文库针对固定化的靶蛋白淘选,以鉴定少数丰富的序列或所谓的“得胜者(winner)”。选择程序在几轮中执行。在每轮之后,通过编码核酸序列的PCR扩增推导所选择的肽的序列。已开发了这种方法的不同变体,并且成功应用于肽发现;最常用的是噬菌体展示、核糖体展示和mRNA展示方法。尽管这些方法在鉴定肽结合剂方面毫无疑问的成功,但它们是昂贵、耗时且容易受到污染的。此外,现有的方法无法确保最佳选择的肽结合剂确实是最好的和最特异的结合剂,以及它们是否可以被改进。首先,在展示方法中没有区分特异性结合剂和非特异性结合剂的机制。其次,仅选择几个“得胜者”阻止展示方法鉴定在选择过程中可能具有缺点的其他潜在的强力结合剂。第三,展示方法需要小心优化关于每种靶蛋白的选择条件。目前,不存在允许选择特定靶的最佳结合剂的系统方法。相反,使用了费力的试验和误差优化技术。本发明通过提供快速可靠发现用于各种靶蛋白的多种特异性结合剂的的系统方法来满足这一需要。
研究肽-蛋白质相互作用的展示方法的替代方案是肽阵列。肽阵列可以由使用固相肽合成而合成的肽制成,然后固定到固体支持物上,或者可以通过原位合成方法直接制备。尽管肽阵列是商购可得的,但它们的应用受到相对低密度和高制造成本的限制。这两个问题均可以通过使用无掩模光导技术来解决,参见(Pellois, Zhou等人(2002) Individually addressable parallel peptide synthesis on microchips)和美国专利号 6,375,903。微阵列一般通过使用光来指导哪些寡核苷酸或肽在阵列上的特定位置处来合成,这些位置被称为特征(feature)。基于MAS的微阵列合成技术允许在标准显微镜载玻片的非常小的区域中平行合成数百万个独特的寡核苷酸或肽特征。
特异性肽结合剂具有多种应用,包括医学诊断、药物开发和生物技术。本发明包括生物相关靶蛋白的一系列结合剂,其通过快速可靠发现高度特异性肽结合剂的替代方法鉴定。
发明概述
本发明提供了通过方法鉴定的生物相关蛋白质的一系列肽结合剂,所述方法包括在微阵列上固定的肽的广泛群体中鉴定靶蛋白与小肽的重叠结合,然后执行经分离的核心命中肽的一轮或多轮成熟,随后为成熟肽的一轮或多轮N末端和C末端延伸。
本发明提供了链霉抗生物素蛋白(SA)、Taq聚合酶和几种人蛋白质的新型肽结合剂:前列腺特异性抗原(PSA)、凝血酶、肿瘤坏死因子α (TNFα)和尿激酶型纤溶酶激活物(uPA)。
在一个实施方案中,本发明是选自下述的蛋白质的肽结合剂:链霉抗生物素蛋白(SA)、Taq聚合酶、人前列腺特异性抗原(PSA)、人凝血酶、人肿瘤坏死因子α (TNFα)和人尿激酶型纤溶酶激活物(uPA),其通过包括以下步骤的方法鉴定:将蛋白质暴露于包含肽结合剂的第一群体的阵列,由此所述蛋白质与群体包含的至少一种肽结合剂结合;鉴定结合蛋白质的群体包含的肽结合剂序列中的重叠,由此确定核心结合剂序列;对核心结合剂序列包含的氨基酸执行至少一种选自以下的改变:单个氨基酸取代、双氨基酸取代、氨基酸缺失和氨基酸插入,由此生成核心结合剂序列的第二群体;将所述第二群体暴露于所述蛋白质,由此所述蛋白质与所述第二群体的至少一个肽序列结合;鉴定第二群体的一个或多个序列,证实与蛋白质的强结合性质,由此确定成熟的核心结合剂序列;执行步骤e中确定的成熟核心结合剂序列的N末端和C末端延伸中的至少一个,由此生成成熟的延伸肽结合剂群体;将蛋白质暴露于包含成熟肽结合剂群体的阵列;并且鉴定成熟肽结合剂群体包含的肽的N末端或C末端肽结合剂序列中的重叠,由此将延伸的、成熟核心肽结合剂序列确定为链霉抗生物素蛋白结合剂,其包含的序列选自表1和2中的序列;或Taq聚合酶结合剂,其包含的序列选自表3中的序列;或前列腺特异性抗原(PSA)结合剂,其包含的序列选自表4中的序列;或凝血酶结合剂,其包含的序列选自表5中的序列;或肿瘤坏死因子结合剂,其包含的序列选自表6中的序列;或尿激酶型纤溶酶激活物(uPA)结合剂,其包含的序列选自表7中的序列。
在一些实施方案中,本发明是链霉抗生物素蛋白的人工肽结合剂,其包含选自表1的序列(LGEYH (SEQ ID NO:1)、FDEWL (SEQ ID NO:2)、PAWAH (SEQ ID NO:3)、DPFGW (SEQ ID NO:4)、和RPGWK (SEQ ID NO:5)),或由选自表2的序列(DYLGEYHGG (SEQ ID NO:6)、NSFDEWLNQ (SEQ ID NO:7)、NSFDEWLQK (SEQ ID NO:8)、NSFDEWLAN (SEQ ID NO:9)、PAPAWAHGG (SEQ ID NO:10)、RAPAWAHGG (SEQ ID NO:11)、SGDPFGWST (SEQ ID NO:12)、RPGWKLW (SEQ ID NO:13))组成。
在一些实施方案中,本发明是权利要求1的Taq聚合酶的人工肽结合剂,其包含选自表3的序列(HEFSF (SEQ ID NO:14)、HYFEF (SEQ ID NO:19)、WKAEK (SEQ ID NO:26)、WDWDW (SEQ ID NO:29)、WKEDW (SEQ ID NO:32)、WTKVK (SEQ ID NO:35)),或由选自表3的序列(FQQHEFSFAQQ (SEQ ID NO:17)、GQHEFSFGPAI (SEQ ID NO:18)、AQGHYFEFEKQ (SEQ ID NO:23)、QGEHYFTFQQP (SEQ ID NO:24)、GEHYFTFEPAG (SEQ ID NO:25)、FGWKTEKFNS (SEQ ID NO:28)、RSWDWDWKKT (SEQ ID NO:31)、FGKWKEDNKW (SEQ ID NO:34)、YEWTKYKNY (SEQ ID NO:38)、YSWNKYKDY (SEQ ID NO:39))组成。
在一些实施方案中,本发明是权利要求1的前列腺特异性抗原(PSA)的人工肽结合剂,其包含来自表4的序列(FEVYL (SEQ ID NO:40)、WTVYA (SEQ ID NO:45)、WEVHL (SEQ ID NO:51)、RSILY (SEQ ID NO:54)),或由选自表4的序列(GQFEVYIPGA (SEQ ID NO:43)、TDFEVYFPKT (SEQ ID NO:44)、ASEWTVYAGN (SEQ ID NO:48)、AGDWTVYAGLG (SEQ ID NO:49)、ALDWQVYAGFG (SEQ ID NO:50)、GTGWEVHLGK (SEQ ID NO:53)、QSCRSILYGD (SEQ ID NO:56))组成。
在一些实施方案中,本发明是权利要求1的凝血酶的人工肽结合剂,其包含选自表5的序列(PINLG (SEQ ID NO:57)、VPIRL (SEQ ID NO:60)、WPINL (SEQ ID NO:62)、APVRL (SEQ ID NO:65)、RQIFL (SEQ ID NO:67)、PIRLK (SEQ ID NO:69)、PVGSR (SEQ ID NO:72)、RDPGR (SEQ ID NO:75)),或由选自表5的序列(WAPINLGQR (SEQ ID NO:58)、PAPINLGNR (SEQ ID NO:59)、YAVPIRLGA (SEQ ID NO:61)、RYWPINLGK (SEQ ID NO:63)、YRWPINLGK (SEQ ID NO:64)、KYAPVRLGS (SEQ ID NO:66)、DGRQIFLQK (SEQ ID NO:68)、NWPIRLKPA (SEQ ID NO:70)、YAPIRLKPQ (SEQ ID NO:71)、GWPVGSRQY (SEQ ID NO:73)、YGPVGSRGF (SEQ ID NO:74)、ENRDPGRSF (SEQ ID NO:76))组成。
在一些实施方案中,本发明是权利要求1的肿瘤坏死因子α (TNFα)的人工肽结合剂,其包含选自表6的序列(AIAIF (SEQ ID NO:77)、TAVFV (SEQ ID NO:83)、ALYLF (SEQ ID NO:88)、VTVYV (SEQ ID NO:91)),或由选自表6的序列(GPAVAIFGG (SEQ ID NO:80)、EAAVAIFGG (SEQ ID NO:81)、QAAVAIFGD (SEQ ID NO:82)、GGTAVFVVNT (SEQ ID NO:86)、DSTAVFVNT (SEQ ID NO:87)、QGALYLFGD (SEQ ID NO:90)、TSVTVWVNN (SEQ ID NO:94)、QSVSVYVNT (SEQ ID NO:95))组成。
在一些实施方案中,本发明是权利要求1的尿激酶型纤溶酶激活物(uPA)的人工肽结合剂,其包含选自表7的序列(NAYFS (SEQ ID NO:96)、NDKFS (SEQ ID NO:100)、YNDKF (SEQ ID NO:101)、HETAR (SEQ ID NO:105)、RSEKF (SEQ ID NO:108)),或由选自表7的序列(YENAYFSGSG (SEQ ID NO:98)、QENAYFSGNG (SEQ ID NO:99)、WGVQNDKFSGS (SEQ ID NO:103)、VVWNDKFSGN (SEQ ID NO:104)、CAHETARNW (SEQ ID NO:107)、EGYGRSEKFT (SEQ ID NO:111)、WGTGRSEKFT (SEQ ID NO:112))组成。
在一些实施方案中,本发明是一种组合物,其包含与肽RDPAPAWAHGGG (SEQ ID NO:243)具有至少80%序列同一性的肽。一种所述肽与链霉抗生物素蛋白分子的复合物,其具有小于10微摩尔(µM)的平衡解离常数(KD)。
在一些实施方案中,本发明是包含与肽AFPDYLAEYHGG (SEQ ID NO:241)具有至少80%序列同一性的肽的组合物。一种所述肽与链霉抗生物素蛋白分子的复合物,其具有小于约100微摩尔(µM)的平衡解离常数(KD)。
附图简述
图1是示出根据本发明的在其上包含肽探针的阵列的示意图。
图2是本发明的过程的实施方案的示意性图示。
图3是示出根据本发明的在其上包含肽探针的阵列的另一个实施方案的示意图。
图4是描绘图2的过程的实施方案的示意图。
发明详述
I. 肽
根据本发明的各种实施方案,公开了新型肽(“肽结合剂”)。每种肽具有在生命科学和医疗领域中的应用。在本文描述的例子中,显示了线性形式的肽。然而,本领域技术人员将立即意识到,肽可以例如通过使N末端与C末端反应而转换为环状形式,如于2014年12月19日提交的美国申请序列号14/577,334中公开的。本发明的实施方案因此包括环状结合剂肽和线性结合剂肽两者。
如本文使用的,术语“肽”、“寡肽”或“肽结合剂”指由氨基酸组成的有机化合物,所述氨基酸可以排列成线性链(通过相邻氨基酸残基的羧基和氨基之间的肽键连接在一起),以环状形式(使用内部位点环化)或受约束的(例如,头尾相接环化形式的“大环”)。术语“肽”或“寡肽”也指较短的多肽,即由小于50个氨基酸残基组成的有机化合物。如本文使用的,大环(或受约束肽)以其用于描述环状小分子例如约500道尔顿至约2,000道尔顿的肽的常规含义使用。
术语“天然氨基酸”指通常在蛋白质中发现并且用于蛋白质生物合成的20种氨基酸之一,以及可以在翻译期间掺入蛋白质内的其他氨基酸(包括吡咯赖氨酸和硒代半胱氨酸)之一。20种天然氨基酸包括组氨酸、丙氨酸、缬氨酸、甘氨酸、亮氨酸、异亮氨酸、天冬氨酸、谷氨酸、丝氨酸、谷氨酰胺、天冬酰胺、苏氨酸、精氨酸、脯氨酸、苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、甲硫氨酸和赖氨酸。术语“所有20种氨基酸”指上文列出的20种天然氨基酸。
术语“非天然氨基酸”指不在由标准遗传密码编码的那些中,或在翻译期间掺入蛋白质内的有机化合物。因此,非天然氨基酸包括氨基酸或氨基酸的类似物,但不限于,氨基酸的D-同分立体异构体(isostereomer)、氨基酸的β-氨基-类似物、瓜氨酸、高瓜氨酸、高精氨酸、羟脯氨酸、高脯氨酸、鸟氨酸、4-氨基-苯丙氨酸、环己基丙氨酸、α-氨基异丁酸、N-甲基-丙氨酸、N-甲基-甘氨酸、正亮氨酸、N-甲基-谷氨酸、叔丁基甘氨酸、α-氨基丁酸、叔丁基丙氨酸、2-氨基异丁酸、α-氨基异丁酸、2-氨基茚满-2-羧酸、硒代甲硫氨酸、脱氢丙氨酸、羊毛硫氨酸、γ-氨基丁酸及其衍生物(其中胺氮已被单烷基化或二烷基化)。
根据本发明的实施方案,将候选肽结合剂固定在支持物表面(例如,微阵列)上呈现。最初选择的肽结合剂任选地经历一轮或多轮延伸和成熟过程,以产生本文公开的结合剂。
II.微阵列
本文公开的肽结合剂使用寡肽微阵列生成。如本文使用的,术语“微阵列”指在固体或半固体支持物的表面上的特征的二维排列。单个微阵列或在一些情况下,多个微阵列(例如,3、4、5或更多个微阵列)可以位于一个固体支持物上。对于具有固定尺度的固体支持物,微阵列的尺寸取决于固体支持物上的微阵列数目。即,每个固体支持物的微阵列数目越高,阵列必须越小以在固体支持物上配合。阵列可以设计成任何形状,但优选地,它们被设计为正方形或矩形。即用产品是在固体或半固体支持物(微阵列载玻片)上的寡肽微阵列。
术语“肽微阵列”或“寡肽微阵列”、或“肽芯片”或“肽表位微阵列”指在微阵列上展示的肽的群体或集合,所述微阵列即固体表面,例如玻璃、碳复合物或塑料阵列、载玻片或芯片。
术语“特征”指微阵列表面上的限定区域。该特征包含生物分子,例如肽、核酸、碳水化合物等等。与其他特征相比,一个特征可以包含具有不同性质例如不同的序列或取向的生物分子。特征的尺寸由两个因素确定:i)阵列上的特征数目,阵列上的特征数目越高,每个单个特征就越小,ii)用于照射一个特征的单个可寻址的铝镜元件数目。用于照射一个特征的镜元件数目越高,每个单个特征就越大。阵列上的特征数目可能受到微镜装置中存在的镜元件(像素)数目的限制。例如,来自Texas Instruments, Inc. (Dallas, Tex.)的现有技术的微镜装置目前含有420万个镜元件(像素),因此这样的示例性微阵列内的特征数目受到这个数目的限制。然而,更高密度的阵列使用其他微镜装置是可能的。
术语“固体或半固体支持物”指具有表面积的任何固体材料,有机分子可以通过键形成与之附着,或者通过电子或静态相互作用(例如共价键或通过特定官能团的复合物形成)与之吸附。支持物可以是材料例如玻璃上的塑料、玻璃上的碳等等的组合。功能表面可以是简单的有机分子,但也可以由共聚物、树枝状聚合物、分子刷等等组成。
术语“塑料”指合成材料,例如具有官能化表面的有机构件块(单体)的均共聚物或异共聚物,使得有机分子可以通过共价键形成而附着,或者通过例如经由官能团的键形成的电子或静态相互作用而吸附。优选地,术语“塑料”指聚烯烃,其是通过烯烃(例如,乙烯丙烯二烯单体聚合物、聚异丁烯)的聚合衍生的聚合物。最优选地,塑料是具有确定的光学性质的聚烯烃,如TOPAS® (TOPAS Advanced Polymers, Inc., Florence, KY)或ZEONOR/EX® (ZEON Chem., Louisville, KY)。
术语“官能团”指形成化学分子部分的原子的众多组合中的任一种,其自身经历特征反应,并且影响分子的剩余部分的反应性。典型的官能团包括但不限于羟基、羧基、醛、羰基、氨基、叠氮化物、炔基、硫醇和腈。潜在的反应性官能团包括例如胺、羧酸、醇、双键等等。优选的官能团是氨基酸的潜在反应性官能团,例如氨基或羧基。
用于生产寡肽微阵列的各种方法是本领域已知的。例如,点样预制肽或通过将试剂例如点样在膜上的原位合成,例证了已知的方法。用于生成更高密度的肽阵列的其他已知方法是所谓的光刻技术,其中所需生物聚合物的合成设计受合适的光不稳定性保护基团(PLPG)控制,在暴露于电磁辐射例如光时释放连接位点用于相应的下一种组分(氨基酸、寡核苷酸)(Fodor等人,(1993) Nature 364:555-556;Fodor等人,(1991) Science 251:767-773)。在现有技术中已知两种不同的光刻技术。第一种是光刻掩模,用于将光引导到合成表面的特定区域,实现PLPG的局部去保护。“掩蔽”方法包括利用底座(例如,“掩模”)的聚合物合成,所述底座与基底接合并且提供在基底和底座之间的反应器空间。这种“掩蔽”阵列合成的示例性实施方案在例如美国专利号5,143,854和5,445,934号中描述,所述美国专利的公开内容在此引入作为参考。然而,该技术的潜在缺点包括需要大量掩蔽步骤,导致相对较低的总产率和高成本,例如长度仅六个氨基酸的肽的合成可能需要超过100次掩模。第二种光刻技术是所谓的无掩模光刻技术,其中光通过数字投影技术例如微镜装置引导到合成表面的特定区域,实现PLPG的局部去保护(Singh-Gasson等人,Nature Biotechn.17 (1999)974-978)。这种“无掩模”阵列合成因此消除了对于耗时和昂贵的暴露掩模生产的需要。应当理解,本文公开的系统和方法的实施方案可以包括或利用上述各种阵列合成技术中的任一种。
提供用于基于光刻法的寡肽微阵列合成的PLPG(光不稳定性保护基团)的使用是本领域众所周知的。用于基于光刻法的生物聚合物合成的常用PLPG是例如α-甲基-6-硝基胡椒基-氧羰基(MeNPOC)(Pease等人,Proc. Natl. Acad. Sci. USA (1994) 91:5022-5026)、2-(2-硝基苯基)-丙氧基羰基(NPPOC)(Hasan等人(1997) Tetrahedron 53: 4247-4264)、硝基藜芦氧羰基(NVOC)(Fodor等人(1991) Science 251:767-773)和2-硝基苄氧羰基(NBOC)。
氨基酸已引入寡肽微阵列的光刻固相肽合成中,所述氨基酸用NPPOC作为光不稳定性氨基保护基团进行保护,其中玻璃载玻片用作支持物(美国专利公开号20050101763)。使用NPPOC保护的氨基酸的方法具有下述缺点:在某些条件下,在用光照射所有(除了一个以外)受保护的氨基酸时的半衰期在大约2至3分钟的范围内。相比之下,在相同的条件下,NPPOC保护的酪氨酸显示出几乎10分钟的半衰期。由于整个合成过程的速度取决于最慢的子过程,这种现象将合成过程的时间增加了3至4倍。同时,通过光生自由基离子对生长中的寡聚物的损害程度随着渐增和过度的光剂量要求而增加。
如本领域技术人员理解的,肽微阵列包括测定原理,由此数千种(或在本发明的情况下,数百万种)肽(在一些实施方案中以多个拷贝呈现)连接或固定到固体支持物(在一些实施方案中,其包括玻璃、碳复合物或塑料芯片或载玻片)的表面。
在一些实施方案中,暴露于目标蛋白质的肽微阵列经历一个或多个洗涤步骤,然后经受检测过程。在一些实施方案中,将阵列暴露于靶向目标蛋白质的抗体(例如抗IgG人/小鼠或抗磷酸酪氨酸或抗-myc)。通常,二抗被荧光标记加上标签,所述荧光标记可以通过荧光扫描仪进行检测。其他检测方法是化学发光、比色法或放射自显影术。在其他实施方案中,目标蛋白质被生物素化,然后通过与荧光团缀合的链霉抗生物素蛋白进行检测。在其他实施方案中,目标蛋白质用特异性标签(例如His标签、Flag标签、myc标签等)标记,并且用对于标签特异性的荧光团缀合的抗体进行检测。
在扫描微阵列载玻片后,扫描仪以标签图像文件格式(*.gif)记录20位、16位或8位数字图像。.gif图像允许对扫描的微阵列载玻片上的每个荧光斑点的解释和定量。该定量数据是用于对微阵列载玻片上测量的结合事件或肽修饰执行统计分析的基础。为了评估和解释检测到的信号,必须执行肽斑点(图像中可见)和相应的肽序列的分配。
肽微阵列是具有肽点样在其上或通过原位合成在表面上直接装配的载玻片。肽理想地通过化学选择性键共价连接,导致具有相同取向的肽用于相互作用概况分析。替代程序包括非特异性共价结合和粘连固定。
根据本发明的一个具体实施方案,在基底上的肽结合剂探针制造中,使用无掩模阵列合成来鉴定特异性肽结合剂。根据这些实施方案,所采用的无掩模阵列合成允许至高达290万种独特肽的超高密度肽合成。每290万个特征/区域具有至高达107个反应性位点可以产生全长肽。还可以设计更小的阵列。例如,代表使用排除半胱氨酸的19种天然氨基酸的所有可能的5聚体肽的广泛列表的阵列将具有2,476,099种肽。在其他实例中,阵列可以包括非天然氨基酸以及天然氨基酸。还可以使用通过使用排除半胱氨酸和甲硫氨酸的18种天然氨基酸的所有组合的5聚体肽的阵列。另外,阵列可以排除其他氨基酸或氨基酸二聚体。在一些实施方案中,阵列可以设计为排除相同氨基酸的任何二聚体或更长的重复序列,以及含有HR、RH、HK、KH、RK、KR、HP和PQ序列的任何肽,以产生具有1,360,732种独特肽的文库。较小的阵列可以具有相同阵列上的每个肽的重复,以增加从阵列数据得出的结论的置信度。
在各种实施方案中,本文所述的肽阵列可以具有附着至肽阵列的固体支持物的至少1.6 x 105种肽,或至高达约1.0 x 108种肽,或两者之间的任何数目。如本文所述,包含特定数目肽的肽阵列可以意指在单个固体支持物上的单个肽阵列,或者肽可以分开并且附着到多于一个固体支持物上,以获得本文所述的肽数目。
根据这些实施方案合成的阵列可以被设计用于肽结合剂发现,所述肽结合剂以线性或环状形式(如本文注意到的)以及具有和不具有修饰如N-甲基或其他翻译后修饰。通过对潜在命中的N末端和C末端执行迭代筛选(如本文进一步详细描述的),阵列还可以设计用于使用块方法的潜在结合剂的进一步扩展。一旦已发现了理想亲和力的命中,则它可以使用成熟阵列(本文进一步描述)的组合进一步成熟,其允许对天然和非天然的各种氨基酸的组合插入、缺失和替换分析。
本发明的肽阵列用于鉴定本发明的特异性结合剂以及所述结合剂的成熟和延伸。
III.肽结合剂发现
新型结合剂的发现可以根据本发明(图2,一般表示为200的方法)完成。根据本发明的一些具体实施方案,可以设计包含数百、数千、数万、数十万或甚至数百万种肽的群体的肽阵列。参考图1,在一些实施方案中,肽110的群体可以被配置为使得肽代表整个蛋白质、基因、染色体或甚至和目标全基因组(例如人类蛋白质组)。另外,肽可以根据特定标准进行配置,由此排除特定的氨基酸或基序。此外,肽可以被配置成使得每个肽包含相同的长度。例如,在一些实施方案中,固定在阵列112上的肽110的群体可以全部包含3-、4-、5-、6-、7-、8-、9-、10-、11-或甚至12-聚体或更多。在一些实施方案中,肽还可以各自包含N末端或C末端序列(例如,106和106’),其中每种肽包含特异性和相同长度的N末端和C末端肽序列(例如,3-、4-、5-、6-、7-甚至8-种或更多种肽)。
根据一些实施方案,肽阵列100被设计为包括至高达290万种肽110的群体,其被配置为使得290万种肽代表固定在阵列112上的基因组的所有可能的5聚体肽108的广泛列表。在一些这样的实施方案中,5聚体肽108(包含阵列的290万种肽)可以排除20种氨基酸中的一种或多种。例如,可以排除半胱氨酸(C),以便帮助控制肽的异常折叠。甲硫氨酸(M)可以被排除为蛋白质组内的罕见氨基酸。其他任选的排除是2个或更多个相同氨基酸的氨基酸重复(以便帮助控制非特异性相互作用,例如电荷和疏水相互作用);或特定的氨基酸基序,例如在链霉抗生物素蛋白结合剂的情况下,由组氨酸(H)-脯氨酸(P)-谷氨酰胺(Q)序列(其是已知的链霉抗生物素蛋白结合基序)组成的氨基酸基序。在一些举例说明性实施方案中,(图1),5聚体肽108可以排除上文列出的排除中的一种或多于一种。本发明的一个实施方案包括肽阵列,其包含代表整个人基因组的至高达290万种5聚体肽110的群体,其中所述5聚体肽108不包括氨基酸C和M中的任一种,不包括2个或更多个氨基酸的氨基酸重复序列,并且不包括氨基酸基序HPQ。本发明的另一个实施方案包括肽阵列,其包含代表由整个人基因组编码的蛋白质含量的至高达290万种5聚体肽,其中所述5聚体肽不包括氨基酸C和M中的任一种,不包括2个或更多个氨基酸的氨基酸重复序列。
应当理解,在阵列上的特定位置处的肽序列是已知的。
根据进一步的实施方案,包含阵列100的至高达290万种肽110的群体的每个5聚体肽108可以在N末端和C末端各自中用摆动合成的5个循环来合成(参见例如,106和106’图1)。如本文使用的,“摆动合成”指位于目标5聚体肽108的N末端或C末端处的肽序列(恒定或随机)的合成(通过本文公开的任何方式)。如图1所示,包含在N末端或C末端处的摆动合成的特定氨基酸由“Z”表示。根据各种实施方案,摆动合成可以包括在N末端或C末端处的任何数目的肽,例如1、2、3、4、5、6、7、8、9、10或更多,甚至例如15或20种肽。此外,摆动合成可以包含具有相同或不同数目的摆动合成的氨基酸的N末端和C末端。
根据各种实施方案,摆动寡肽组合物106、106’在氨基酸组成和氨基酸比率/浓度方面是柔性的。例如,摆动寡肽组合物可以包含2种或更多种氨基酸的混合物。这种柔性摆动混合物的举例说明性实施方案包括以3:1比率的甘氨酸(G)和丝氨酸(S)的摆动寡肽组合物106、106’。柔性摆动混合物的其他实例包括等浓度(例如等比率)的氨基酸G、S、腺嘌呤(A)、缬氨酸(V)、天冬氨酸(D)、脯氨酸(P)、谷氨酸(E)、亮氨酸(L)、苏氨酸(T)和/或等浓度(例如等比率)的氨基酸L、A、D、赖氨酸(K)、T、谷氨酰胺(Q)、P、F、V、酪氨酸(Y)。其他实例包括以等浓度包含的20种已知氨基酸中的任意的摆动寡肽组合物106、106’。
如本文公开的,各种实施方案的摆动寡肽合成允许在具有随机和定向合成氨基酸的组合的阵列上生成肽。例如,在阵列上的寡肽探针可以包含具有以下述格式的肽序列的组合的15聚体肽:ZZZZZ – 5聚体 - ZZZZZ,其中Z是来自特定摆动寡肽混合物的氨基酸。
在一些实施方案中,特征可以包含107种肽。在一些这样的实施方案中,关于每个特征的群体复杂性可以根据摆动混合物的复杂性而变。如本文公开的,使用在半定向合成中的摆动合成来创建这样的复杂性允许在阵列上的结合剂筛选,使用具有至高达1012/阵列的多样性的肽。链霉抗生物素蛋白和PSA的结合剂筛选的实例如下所述(另外的蛋白质靶例如uPA或TNF根据所阐述的方法和系统也是可能的)。
已进一步发现接头106(图1)的长度可以变化并且是任选的。在一些实施方案中,代替5Z接头,可以使用3Z或1Z接头。在这样的实施方案中,Z可以使用所有20种氨基酸的随机混合物来合成。已发现当使用1Z接头或不使用接头时,相同的靶可以产生另外的5聚体结合剂序列。已发现,改变接头的长度或消除接头导致另外的肽结合剂的鉴定,所述另外的肽结合剂使用例如原始5Z接头未发现。
在实践中,参考图1,提供了包含固体支持物102的阵列100,所述固体支持物102具有反应性表面104(例如,反应性胺层),所述反应性表面104具有与之固定的肽110的群体(例如,代表整个人蛋白质组的5聚体的群体)。根据这种实施方案,包含肽110的群体的示例性5聚体肽不包括氨基酸C和M中的任一种,不包括2个或更多个氨基酸的氨基酸重复序列,并且不包括氨基酸基序HPQ。根据这样的举例说明性实施方案,代表整个人蛋白质组的肽110的这些群体将包括包含群体110的1,360,732种单独肽。在一些实施方案中,复制或重复可以放置在相同的阵列上。例如,包含单个复制的群体110将包含2,721,464种单独肽。另外,肽110的群体各自包含N末端和C末端摆动合成寡肽106、106’,其例如由五个氨基酸组成,所述五个氨基酸各自由以3:1比率的氨基酸甘氨酸和丝氨酸组成。摆动寡肽106、106’可以被省略或替换为选自所有20种氨基酸、非天然氨基酸例如6-氨基-己酸的随机混合物的单一氨基酸。一些实施方案可以包括非氨基酸部分,例如聚乙二醇(PEG)。
现在一般参考图2的过程200的步骤202,将示例性阵列(例如图1所示的100)暴露于浓缩的、纯化的目标蛋白质(与标准微阵列实践一样),由此该蛋白质可以在肽的任何群体(例如图1所示的110)处结合,与包含群体的其他肽无关。在暴露于目标蛋白质后,例如借助于将阵列暴露于抗体(对于蛋白质特异性的),所述抗体具有与之附着的可报告标记(例如过氧化物酶),来测定目标蛋白质与肽结合剂的结合。因为在阵列上的每个位置处的每个5聚体的肽序列是已知的,所以能够将蛋白质与特异性5聚体肽序列的结合(和结合强度)制成图表、或定量、或比较和对比。比较蛋白质结合与包含群体的肽的一种这样的方法是检查基于原理分析分布的聚类中的结合,例如在Standardizing and Simplifying Analysis of Peptide Library Data, Andrew D White等人,J Chem Inf Model, 2013, 53(2),第493-499页中所述,并且在本文中示出。如本文例示的,蛋白质-5聚体结合的聚类(即,“命中”)(在基于原理分析分布的聚类中显示)指示具有重叠肽序列的5聚体。如下文更详细地证实的,从(每个簇的)重叠肽序列中,可以鉴定“核心命中”肽序列(例如,由阵列的突出的蛋白质-肽结合事件共享的肽序列),或至少假设并且构建用于进一步评估。(注意,应当理解,如本文例示的阵列可以鉴定多于一个“核心命中”肽序列。进一步应当理解,由于在基于原理分析分布的聚类期间的重叠和相邻序列的可能鉴定,“核心命中”肽序列能够包含比例如包含肽群体的5聚体肽结合剂更多的氨基酸。
IV.肽成熟
现在参考图2中的过程200的步骤204,在鉴定核心命中肽序列(通过本文公开、描述和例示的肽结合剂发现202的过程)后,“肽成熟”204的过程,由此核心命中肽序列在核心命中肽的每个位置处以各种方式(通过氨基酸取代、缺失和插入)改变,以便进一步优化/验证适当的核心命中序列。例如,根据一些实施方案(例如,其中核心命中肽序列包含给定数目,例如7个氨基酸),产生成熟阵列。根据本发明,成熟阵列可以具有与之固定的核心命中肽的群体,由此在核心命中肽中的每个氨基酸在每个位置处已经历了氨基酸取代。
为了进一步描述命中成熟过程204,将示例/假设的核心命中肽描述为由5聚体肽组成,所述5聚体肽具有氨基酸序列–M1M2M3M4M5-。根据本发明,命中成熟204可以涉及在位置1、2、3、4和5处的氨基酸取代、缺失和插入中的任一种、或任一种的组合或全部。例如,关于假设的核心命中肽–M1M2M3M4M5-,本发明的实施方案可以包括在位置1处的氨基酸M被其他19种氨基酸各自取代(例如,A1M2M3M4M5-、P1M2M3M4M5-、V1M2M3M4M5-、Q1M2M3M4M5-等)。每个位置(2、3、4和5)也将具有氨基酸M被其他19种氨基酸各自取代(例如,对于位置2,取代将类似M1A2M3M4M5-、 M1Q2M3M4M5-、 M1P2M3M4M5-、 M1N2M3M4M5-等)。应当理解,产生了包含核心命中肽的取代和/或缺失和/或插入序列的肽(在阵列上固定)。
在根据本发明的命中成熟204的一些实施方案中,可以执行双重氨基酸取代。双重氨基酸取代包括改变在给定位置处的氨基酸(例如,M→P取代,例如在位置1处),然后在位置2处的氨基酸用其他19种氨基酸各自取代在位置2处的氨基酸。重复该过程,直到组合了位置1和2的所有可能组合。作为示例,返回参考具有含氨基酸序列–M1M2M3M4M5–的5聚体肽的假设核心命中肽,关于位置1和2的双重氨基酸取代可以包括例如在位置1处的M→P取代,以及随后在位置2处的所有20种氨基酸的取代(例如,-P1A2M3M4M5–、– P 1F2M3M4M5–、–P1V2M3M4M5–、– P 1E2M3M4M5–等),在位置1处的M→V取代,以及随后在位置2处的所有20种氨基酸的取代(例如,– V 1A2M3M4M5–、– V 1F2M3M4M5–、–P1V2M3M4M5–、– V 1E2M3M4M5–等),在位置1处的M→A取代,以及随后在位置2处的所有20种氨基酸的取代(例如,– A 1A2M3M4M5–、– A1F2M3M4M5–、– A 1V2M3M4M5–、– A 1E2M3M4M5–等)。
在根据本发明的命中成熟204的一些实施方案中,可以执行关于核心命中肽的每个氨基酸位置的氨基酸缺失。氨基酸缺失包括制备包含核心命中肽序列,但从核心命中肽序列中缺失单个氨基酸的肽(使得产生其中在每种肽处的氨基酸被缺失的肽)。作为示例,返回参考具有含氨基酸序列–M1M2M3M4M5–的5聚体肽的假设核心命中肽,氨基酸缺失将包括制备具有下述序列的一系列肽:–M2M3M4M5–;–M1M3M4M5–;–M1M2M4M5–;–M1M2M3M5–;和–M1M2M3M4–。应该注意,在假设的5聚体的氨基酸缺失后,产生5个新的4聚体。根据本发明的一些实施方案,可以对于生成的每个新的4聚体执行氨基酸取代或双重氨基酸取代扫描。
类似于上文讨论的氨基酸缺失扫描,本文公开的命中成熟204的一些实施方案可以包括氨基酸插入扫描,由此在核心命中肽的每一个位置之前和之后插入20种氨基酸中的每种。作为示例,返回参考具有含氨基酸序列–M1M2M3M4M5–的5聚体肽的假设核心命中肽,氨基酸插入扫描将包括下述序列:–XM1M2M3M4M5–;–M1XM2M3M4M5–;–M1M2XM3M4M5–;–M1M2M3XM4M5–;–M1M2M3M4XM5–;和–M1M2M3M4M5X–(其中X表示选自20种已知氨基酸的单独氨基,或特定的、限定的氨基酸亚组,由此对于20种氨基酸各自或限定的氨基酸亚组产生肽复制)。
还应当理解,上述氨基酸取代的肽、双重氨基酸取代的肽、氨基酸缺失扫描肽和氨基酸插入扫描肽还可以包括N末端和C末端摆动氨基酸序列之一或两者(类似于如在图1的106、106’处所述)。与图1中描述的N末端和C末端摆动氨基酸序列一样,N末端和C末端摆动氨基酸序列可以包含少至1个氨基酸或者多达15个或20个氨基酸,并且N末端摆动氨基酸序列可以与C末端摆动氨基酸序列相同长度,长于或短于C末端摆动氨基酸序列,或完全省略。此外,N末端和C末端摆动氨基酸序列可以包含以任何给定比率的任何限定的氨基酸组(例如,以3:1比率的甘氨酸和丝氨酸,或者是所有20种氨基酸的随机混合物)。
在图4上描述的命中成熟204的具体实施方案中,7个氨基酸的核心命中肽(424)经历彻底的单一和双重氨基酸筛选,并且包括N末端和C末端摆动氨基酸序列426和426’两者。在这个实例中,末端序列包含三个氨基酸(全部为甘氨酸)。在其他实施方案中,不同的末端序列可以通过在成熟过程期间使用氨基酸的不同混合物来添加。可以使用任何单一氨基酸或者由两个或更多个氨基酸组成的任何“混合物。在其他实施方案中,使用以配给3G:1S的甘氨酸(G)和丝氨酸(S)的混合物。在其他实施方案中,使用由所有20种氨基酸的随机混合物组成的“随机混合物”。在一些实施方案中,使用非天然氨基酸,例如6-氨基-己酸。一些实施方案可以包括非氨基酸部分,例如聚乙二醇(PEG)。
一旦制备核心命中肽的各种取代、缺失和插入变化(例如,在固体支持物例如微阵列上以固定的方式),则测定纯化的、浓缩靶蛋白的结合强度。如下文提供的实施例中所示,命中成熟的过程允许将核心命中肽精制成氨基酸序列,证实用于以最高亲和力结合靶蛋白的最优选氨基酸序列。
V.肽延伸(N末端和C末端)
在5聚体阵列实验中鉴定的基序能够仅代表最佳蛋白质结合剂的短形式。我们已开发了通过从一个或两个N末端和C末端经由一个或多个氨基酸延伸选自5聚体阵列的序列,来鉴定更长基序的策略。从选择的肽开始并且在每个末端上添加一个或多个氨基酸,可以创建延伸文库用于进一步选择。例如,从单一肽开始并且使用所有20种天然氨基酸,可以产生160,000种独特肽的延伸文库。在一些实施方案中,经延伸的肽各自重复合成。
现在参考图2中的步骤206,在核心命中肽的成熟(使得核心命中肽的更优化的氨基酸序列被鉴定用于结合靶蛋白)后,N末端和/或C末端位置经历延伸步骤,由此成熟的核心命中肽的长度进一步延伸,用于增加对于靶肽的特异性和亲和力。
根据本发明的N末端延伸的各种实施方案,并且参考图3,一旦通过成熟过程(图2的204)鉴定成熟的核心命中肽序列312,就将来自肽结合剂发现步骤(102,图1)的群体的每个特异性肽探针加入(或合成到其上)成熟的核心命中肽312的N末端。以这种方式,将每种肽序列(108,图1)的最C末端氨基酸直接添加到成熟的核心命中肽312的最N末端氨基酸附近。
同样地,根据本发明的C末端延伸的各种实施方案,并且参考图3,一旦通过成熟过程(图2的204)鉴定成熟的核心命中肽序列312,就将来自肽结合剂发现步骤(102,图1)的群体的每个特异性肽探针加入成熟的核心命中肽312的C末端。以这种方式,将每种肽序列(108,图1)的最N末端氨基酸直接添加到成熟的核心命中肽312的最C末端氨基酸附近。
根据本发明的一些实施方案(图3),在C末端延伸和N末端延伸中使用的成熟核心命中肽之一或两者还可以包括N末端和C末端摆动氨基酸序列之一或两者(图1的106、106’)。与图1中描述的N末端和C末端摆动氨基酸序列一样,N末端和C末端摆动氨基酸序列可以包含少至1个氨基酸或者多达15个或20个氨基酸(或更多),并且N末端摆动氨基酸序列可以与C末端摆动氨基酸序列相同长度,长于或短于C末端摆动氨基酸序列。此外,N末端和C末端摆动氨基酸序列可以通过在成熟过程期间使用氨基酸的不同混合物来添加。可以使用任何单一氨基酸或者由两个或更多个氨基酸组成的任何“摆动混合物”。在另外其他实施方案中,使用由以配给3G:1S的甘氨酸(G)和丝氨酸(S)的混合物组成的“柔性摇摆混合物”。在其他实施方案中,使用由所有20种氨基酸的随机混合物组成的“随机摆动混合物”。在一些实施方案中,还可以使用非天然氨基酸,例如6-氨基-己酸。一些实施方案可以包括非氨基酸部分,例如聚乙二醇(PEG)。
在图3中,显示了肽延伸阵列300,其具有用于N末端延伸的肽群体314和用于C末端延伸的肽群体316。肽的每个群体314、316可以含有来自肽阵列100(在肽结合剂发现的步骤204中使用的)的肽110的完全群体。如进一步示出的,两个肽群体314、316的每种肽可以含有相同的成熟核心肽312,各自具有不同的肽探针308(来自图1的肽结合剂发现步骤102的探针群体)。还如图3中所示,群体314、316的每种肽包括N末端和C末端摆动氨基酸序列。
在一些实施方案中,将延伸阵列300(包括群体314和316)暴露于浓缩的、纯化的目标蛋白质(如在肽结合剂发现中,过程200的步骤201),由此该蛋白质可以结合群体314、316的任何肽,与包含群体314、316的其他肽无关。在暴露于目标蛋白质之后,例如通过将群体314、316的单独肽和蛋白质的复合物暴露于抗体(对于所述蛋白质特异的)(所述抗体具有与之附着的可报告标记(例如过氧化物酶)),来测定靶蛋白与群体314、316的肽的结合。在另一个实施方案中,目标蛋白质可以用报告分子直接标记。因为关于阵列上的每个位置的(每个5聚体的)肽探针序列308是已知的,所以能够将蛋白质与包含成熟的核心命中肽312的特异性探针的结合(和结合强度)制成图表/定量/比较/对比与相应的肽探针308。比较(目标)蛋白质与成熟的核心命中肽312-肽探针308组合(包含群体314或316)的组合的示例性方法是检查基于原理分析分布的聚类中的结合强度,例如在Standardizing and Simplifying Analysis of Peptide Library Data, Andrew D. White等人,J Chem Inf Model, 2013, 53(2),第493-499页中所述。如本文例示的,在基于原理分析分布的聚类中显示的与(群体314、316的)相应探针结合的蛋白质的聚类指示具有重叠肽序列的肽探针5聚体308。如下文更详细地证实的,从(每个聚簇的)重叠肽序列中,延伸的、成熟的核心命中肽序列可以被鉴定,或至少被假设并且构建用于进一步评估。在本申请的一些实施方案中,延伸的、成熟的核心命中肽经历成熟过程(如本文描述和例示并且在图2的步骤204处示出的)。
延伸的肽结合剂的另外一轮优化也是可能的。例如,第三轮结合剂优化可以包括用甘氨酸(G)氨基酸延伸在延伸阵列实验中鉴定的序列。其他优化可以包括产生双重取代/缺失文库,其包括参考序列的所有可能的单一和双重取代/缺失变体,即在任何前述步骤中优化和选择的肽结合剂。
VI.延伸、成熟的核心命中肽结合剂的特异性分析
在鉴定延伸的、成熟的核心命中肽之后,可以通过本领域可获得的测量肽亲和力和特异性的任何方法执行特异性分析。特异性分析的一个实例包括“BIACORE™”系统分析,其用于在对靶指定的分子相互作用、动力学速率(“结合(on),结合和“离开”,解离)和亲和力(结合强度)方面表征分子。BIACORE™是General Electric Company的商标,并且可经由公司网站获得。
图4是新型肽结合剂鉴定方法(例如,图2的过程200)的简要原理概述。如所示,肽结合剂发现402通过在阵列401上制备(例如,通过无掩模阵列合成)肽群体来执行。如所示,每种肽包括N末端摆动合成406’和C末端摆动合成406的5个“循环”(例如,N末端和C末端摆动合成包含五个氨基酸)。应当理解,C末端和N末端的摆动合成可以包含如上所述的任何组合物(例如,仅以3:1 [G:S]比率的氨基酸G和S,或所有20种氨基酸的随机混合物)。每种肽还显示为包含5聚体肽结合剂404,其如上所述可以包含至高达290万种不同的肽序列,使得代表整个人蛋白质组。此外,应当注意,不同的肽结合剂404可以根据特定“规则”而合成(例如,无C或无M个氨基酸,无相同氨基酸以邻接次序的重复序列,或无已知结合靶蛋白的基序,例如用于链霉抗生物素蛋白的HPQ氨基酸基序)。如上所述,将目标蛋白质靶(例如,以纯化和浓缩形式)暴露于肽结合剂404,并且对结合进行评分(例如,借助于规定的聚类分析),由此基于重叠的结合基序鉴定“核心命中肽”序列。
在一些实施方案中,在鉴定核心命中肽序列时,可以采取彻底的成熟过程420。在一些实施方案中,核心命中肽(例示为7聚体,424)在具有N末端和C末端摆动两者的阵列401上合成(在步骤420处的例子显示为仅甘氨酸(G)氨基酸的N末端和C末端摆动的3个循环,尽管摆动氨基酸可以如上所述变化)。在彻底成熟的一些实施方案中,在阵列401上合成肽,其中核心命中肽424的每一个氨基酸位置被其他19种氨基酸中的各自取代,或者在阵列401上合成双重氨基酸取代(如上所述)或在阵列401合成氨基酸缺失扫描,或者在阵列401上合成氨基酸插入扫描。在一些情况下,执行所有上述成熟过程(并且对于由于氨基酸缺失和插入扫描而生成的新肽如上所述重复)。在合成包含各种肽(包括本文所述的取代、缺失和插入在内)的成熟阵列420时,将靶蛋白暴露于成熟阵列420上的经修饰的核心命中肽424,并且测定结合强度,由此鉴定“成熟的核心命中肽”序列。
在进一步的实施方案中,在鉴定“成熟的核心命中肽”序列之后,可以执行N末端和C末端延伸之一或两者(在430处显示为包括N末端延伸432和C末端延伸431两者)。N末端和C末端延伸涉及合成具有分别在N末端或C末端处合成的肽结合剂404(在该实例中,5聚体)的成熟核心命中肽。如在431处所示,C末端延伸涉及五轮摆动合成436,并且5聚体肽结合剂434的群体是成熟的核心命中肽438 C末端合成的,然后为N末端的摆动合成436’的另外5个循环。类似地,如在432处所示,N末端延伸涉及五轮摆动合成(如上所述)436,其在成熟的核心命中肽418的C末端合成,然后为5聚体肽结合剂434的群体和N末端合成的摆动合成436’的另外5个循环(成熟核心命中肽438的)。在合成包含各种延伸肽(包括C末端和N末端延伸肽在内)的延伸阵列430时,将靶蛋白暴露于在延伸阵列430上合成的C末端和N末端延伸肽群体431、432,并且对结合进行评分(例如,借助于规定的聚类分析),由此鉴定C末端、N末端延伸的、成熟核心命中肽序列。如由箭头440所示,根据一些实施方案,在延伸的、成熟的核心命中肽被鉴定之后,用于延伸的成熟核心命中肽的成熟过程420可以被重复,然后对于由此产生的任何改变的肽序列也可以重复延伸过程。
VII.关于特异性靶的结合剂肽的鉴定
根据本发明的实施方案,将肽微阵列与包括靶蛋白的样品一起温育,以产生关于链霉抗生物素蛋白(SA)、Taq聚合酶和人蛋白质的特异性结合剂:前列腺特异性抗原(PSA)、凝血酶、肿瘤坏死因子α (TNFα)和尿激酶型纤溶酶激活物(uPA)。
本发明提供了肽结合剂的各种用途。除下文关于每种类型的结合剂指示的具体用途之外,一些用途对于所有结合剂是共同的。例如,对于下文列出的各个靶,本发明的肽结合剂可以用作亲和纯化或富集试剂。在这样的实施方案中,肽结合剂的特异性结合将帮助靶蛋白的纯化或富集,所述靶蛋白例如来自用于诊断分析的患者样品或来自用于获得以其纯形式的靶分子的生物合成反应器。在一些实施方案中,用于相同靶的多重结合剂中的两个或更多个可以经由接头连接。连接的结合剂可以影响基于亲合力(avidity)的靶向,亲合力(avidity)是多重亲和力(affinity)的累积强度。
在另外其他实施方案中,本发明的结合剂可以充当治疗剂。在这样的实施方案中,肽结合剂包含在生理条件下就与其靶的最佳结合和毒性的缺乏已进化且选择的序列。
A. 链霉抗生物素蛋白(SA)结合剂
在一些实施方案中,本发明是对于链霉抗生物素蛋白(SA)具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表1中列出的序列组成的肽。本发明进一步包括包含表1中列出的序列的肽,例如由表2中列出的序列组成的肽。除表2中列出的实例之外,包含表1中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表1. SA结合剂
表2. SA结合剂
对于链霉抗生物素蛋白特异性的这些新型肽结合剂可以用于其中需要检测或捕获链霉抗生物素蛋白、链霉抗生物素蛋白的片段或链霉抗生物素蛋白-生物素复合物的任何应用中。测定包括微阵列、免疫组织化学、色谱法、酶联免疫吸附测定(ELISA)、原位杂交和掺入与新型肽结合剂连接的一个或多个核苷酸的测定。
例如,本发明的链霉抗生物素蛋白结合肽可以用于包含Strep-标签II序列的靶分子的亲和捕获,参见David S. Wilson等人,(2001) The use of mRNA display to select high-affinity protein-binding peptides PNAS第98卷,no. 7, 3750-3755。
在一些实施方案中,本发明提供了包含本文公开的对于链霉抗生物素蛋白特异性的一种或多种新型肽结合剂的试剂盒。这样的试剂盒可以包含选自表1-2中列出的一种或多种肽结合剂或包含选自表1-2中列出的任何序列的肽结合剂。
Taq聚合酶结合剂
在一些实施方案中,本发明是对于Taq聚合酶具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表3第1列中列出的5聚体序列组成的肽。本发明进一步包括包含表3第1列中列出的5聚体序列的肽,例如由表3第2和3列中列出的序列组成的肽。除表3第2列和第3列中列出的实例之外,包含表3第1列中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表3. Taq聚合酶结合剂
可以通过在Taq聚合酶的存在下在引物延伸测定中测试候选肽,来选择包含表3第1列中列出的5聚体序列的关于Taq聚合酶的另外肽结合剂。将选择在环境温度下而不是在典型PCR延伸温度(65至75℃之间)下抑制引物延伸的候选物。在环境温度下的引物延伸的这种抑制(“热启动”)避免了当非特异性引物退火和延伸可能发生时的较低温度下DNA的非特异性扩增。在较高的温度下,仅特异性(基本上互补的)引物可以通过聚合酶延伸。在这样较高的温度下,特异性肽结合剂释放聚合酶的抑制,允许发生特异性引物延伸。
在一些实施方案中,本发明是在包含表3中列出的序列的一种或多种肽存在下经由聚合酶链反应(PCR)扩增核酸的方法。
B. 前列腺特异性抗原(PSA)结合剂
在一些实施方案中,本发明是对于人前列腺特异性抗原(SA)具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表4第1列中列出的序列组成的肽。本发明进一步包括包含表4第1列中列出的序列的肽,例如由表4第2和3列中列出的序列组成的肽。除表4第2列和第3列中列出的实例之外,包含表4第1列中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表4. PSA结合剂
应当理解,对于PSA特异性的这些新型肽结合剂可以用于任何数目的诊断测定,包括但不限于微阵列、免疫组织化学(IHC)、色谱法、酶联免疫吸附测定(ELISA)、原位杂交和掺入与新型肽结合剂连接的一个或多个核苷酸的测定。像这样,本文公开的新型肽结合蛋白可以用于诊断患者中的前列腺癌。
此外,本文公开的每种新型PSA结合剂可以与一种或多种另外的肽结合剂组合,例如以形成肽结合剂实验对象组(例如,如在多路化诊断测定中)。另外的结合剂可以靶向PSA或与诊断相关的其他肽。这样的实验对象组可以帮助诊断前列腺癌或区分前列腺癌和良性前列腺增生。在一些实施方案中,靶向PSA的多重结合剂中的两种或更多种可以经由接头连接。连接的结合剂具有由于亲合力(avidity)而增加的亲和力。
本发明的PSA结合剂可以用于富集患者样品中发现的PSA,用于任何后续的定性或定量分析。
在一些实施方案中,本发明是通过下述就前列腺癌评估患者的方法:获得测试样品,并且用本文公开的一种或多种新型肽结合剂就PSA测定样品。在一些实施方案中,定量受试者的测试样品内的PSA,用于确定前列腺癌的存在。测试样品包括体液,例如血液、血浆、血清、尿、前列腺组织和前列腺液(即,紧围绕前列腺的流体)。测试样品进一步包括例如通过活组织检查获得的固体组织或器官样品。分开的细胞可以通过分离技术例如离心或细胞分选从体液或组织或器官获得。样品可以是冷冻的、新鲜的、固定的(例如福尔马林固定的)或包埋的(例如石蜡包埋的)。在评价样品中的标记物的量之前,样品可以经受各种众所周知的收集后制备和贮存技术。
在一个实施方案中,本发明是通过测定来自受试者的测试样品中PSA的存在或量来诊断受试者中的前列腺癌的方法。如果样品中的PSA量大于参考浓度,则一些实施方案包括提供前列腺癌的诊断。
C. 凝血酶结合剂
在一些实施方案中,本发明是对于人凝血酶具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表5第1列中列出的序列组成的肽。本发明进一步包括包含表5第1列中列出的序列的肽,例如由表5第2和3列中列出的序列组成的肽。除表5第2列和第3列中列出的实例之外,包含表5第1列中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表5. 凝血酶结合剂
凝血酶是凝血途径的关键组分。这种多因素酶原激活途径以凝血酶的生成而告终,所述凝血酶然后切割纤维蛋白原以产生纤维蛋白并且经由其凝血酶受体激活血小板。凝血酶还激活凝血因子V、VIII和XIII,允许纤维蛋白形成凝块。凝血酶的水平升高是血栓形成的原因,导致心脏病发作、中风以及肺和静脉栓塞。(参见Esmon, C.T. (2000) Regulation of blood coagulation, Biochim. Biophys. Acta 1477:349.)凝血酶或凝血酶水平的准确检测的临床应用之一是就这些状况的风险监测患者。
在一些实施方案中,本发明包括使用本文公开的一种或多种凝血酶结合肽,在人样品中检测凝血酶或测量凝血酶水平的方法。在其他实施方案中,本发明是通过使用本文公开的一种或多种凝血酶结合肽,在患者样品中检测凝血酶或测量凝血酶水平,就血栓栓塞监测患者的方法。在一些实施方案中,本发明是用于在人样品中检测凝血酶或测量凝血酶水平的试剂盒,所述试剂盒包含本文公开的一种或多种凝血酶结合肽。
在另一个实施方案中,本文公开的凝血酶结合肽用于结合和抑制患者中的凝血酶。直接凝血酶抑制剂(DTI)及其预防凝结的用途是本领域已知的。比伐卢定(Angiomax)是与药用水蛭医蛭(Hirudo medicinalis)的唾液中发现的天然肽水蛭素有关的合成凝血酶结合肽。本发明提供了生成新的凝血酶结合肽以改善或补充在体内阻断凝血酶的现有能力的方法。在该实施方案中,该方法包括就在生理条件下与凝血酶最佳结合且缺乏毒性,而进一步进化和选择本文公开的一种或多种凝血酶结合肽。
D. 肿瘤坏死因子α (TNFα)结合剂
在一些实施方案中,本发明是对于人肿瘤坏死因子α (TNFα)具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表6第1列中列出的序列组成的肽。本发明进一步包括包含表6第1列中列出的序列的肽,例如由表6第2和3列中列出的序列组成的肽。除表6第2列和第3列中列出的实例之外,包含表6第1列中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表6. TNFα结合剂
TNF-α在针对感染和炎症的免疫应答中起主要作用。它是介导针对微生物,尤其是细胞内微生物的宿主-抗性的细胞因子,但其也被认为在自身免疫疾病如类风湿性关节炎(RA)中起关键作用。使用抗TNF-α抗体(例如,英夫利昔单抗,商标名称Remicade或Centocor)的疗法已被批准用于RA的治疗。(参见Haerter, G.等人,Clin Infect Dis. (2004) 39 (9):e88-e94.)。
在一些实施方案中,本发明包括使用本文公开的一种或多种TNF-α结合肽,在人样品中检测TNF-α或测量TNF-α水平的方法。在该实施方案的变化中,患者患有感染或者自身免疫疾病或状况。在一些实施方案中,本发明是用于在人样品中检测TNF-α或测量TNF-α水平的试剂盒,所述试剂盒包含本文公开的一种或多种凝血酶结合肽。
在另一个实施方案中,本文公开的TNF-α结合肽用于结合并且抑制患有感染或者自身免疫疾病或状况的患者中的TNF-α。在该实施方案中,所述方法包括就在生理条件下与膜结合或可溶形式的TNF-α最佳结合且缺乏毒性,而进一步进化和选择本文公开的一种或多种TNF-α结合肽。
E. 尿激酶型纤溶酶激活物(uPA)
在一些实施方案中,本发明是对于人尿激酶型纤溶酶激活物(uPA)具有特异性亲和力的经分离的人工肽。在该实施方案中,本发明包括由表6第1列中列出的序列组成的肽。本发明进一步包括包含表7第1列中列出的序列的肽,例如由表7第2和3列中列出的序列组成的肽。除表7第2列和第3列中列出的实例之外,包含表7第1列中列出的序列的较短或较长的肽(例如,5、6、7、8、9和至高达20个氨基酸)也是本发明的部分。
表7. uPA结合剂
尿激酶型纤溶酶激活物(uPA)是丝氨酸蛋白酶,其在纤维蛋白溶解过程中起主要作用,在其中它将纤溶酶原转化成纤溶酶。它是组织炎症和伤口愈合过程的关键调节剂。参见Sugioka, K.,等人(2014) Invest. Ophthalmol. Vis. Sci. 55:5338。除其在纤维蛋白溶解系统中的众所周知的功能之外,通过调节白细胞对发炎组织的外渗,uPA越来越多地被视为炎症应答的关键组分。这些过程与急性和慢性心血管疾病有关。参见Reichel, C.等人(2012) Trends in Cardiovascular Med. 22:192。uPA在各种肿瘤类型的肿瘤侵袭和进展中也起重要作用。参见Fuessel, S.等人BMC Cancer 2014, 14:974。uPA的水平对于各种疾病或状况具有诊断价值。高度特异性的uPA抑制剂的使用是用于预防和治疗肿瘤和心血管病理状况的策略。
在一些实施方案中,本发明包括使用本文公开的一种或多种uPA结合肽,在人样品中检测uPA或测量uPA水平的方法。在该实施方案的变化中,患者患有肿瘤或心血管疾病或状况。在一些实施方案中,本发明是用于在人样品中检测uPA或测量uPA水平的试剂盒,所述试剂盒包含本文公开的一种或多种uPA结合肽。
在另一个实施方案中,本文公开的uPA结合肽用于结合并且抑制患有肿瘤或者心血管疾病或状况的患者中的uPA和因此的uPA途径。在该实施方案中,所述方法包括就在生理条件下与uPA最佳结合且缺乏毒性,而进一步进化和选择本文公开的一种或多种uPA结合肽。
实施例
实施例1. 链霉抗生物素蛋白结合剂
文库合成
为了创建肽文库,合成了5聚体肽的阵列,其具有了排除Cys和Met的18种天然氨基酸,排除两个或多个相同的氨基酸的任何重复序列,以及排除含有HR、RH、HK、KH、RK、KR、HP和PQ序列的任何肽,以鉴定除其他已知的HPQ和HPM样基序外的链霉抗生物素蛋白的结合剂。使用Z接头(Z使用Gly和Ser的3:1混合物合成)或J接头(J使用所有20种天然氨基酸的等摩尔混合物合成)合成阵列,并且在0.05% Tween 20的存在下,在4℃下与在具有1%碱性可溶性酪蛋白的1X TE结合缓冲液中的0.3 μg/ml Cy5标记的链霉抗生物素蛋白结合过夜。表8显示了链霉抗生物素蛋白与用不同接头合成的5聚体文库结合的结果。
表8. 使用具有不同接头的5聚体文库选择的二级SA结合剂核心基序
延伸文库
结合剂优化策略的第二步包括使用所有20种天然氨基酸的核心基序的延伸,所述核心基序通过来自N末端和C末端的两个氨基酸用5聚体文库鉴定。对于延伸,我们使用由3Z接头或无接头生成的相同的文库,如上表8中所示。表9显示了对于每个扩增文库鉴定的三种最佳结合剂,XXFDEWLXX (SEQ ID NO:121)和XXPAWAHXX (SEQ ID NO:125),其具有两个不同的接头。
表9. 接头对SA结合剂中的核心基序延伸的作用
尽管对于两种类型的接头,一些选择的序列是相同的,但表9中对于扩增文库显示的数据清楚地证实选择途径可以受到文库背景的影响。
实施例2. 前列腺特异性抗原(PSA)结合剂
我们通过使用关于较早描述的具有5Z接头的5聚体阵列文库和具有3Z接头的延伸阵列的数据,并且执行更广泛的取代/缺失实验,来优化PSA的肽结合剂的序列。结果显示于表10中。
表10. PSA结合剂
实施例3. 凝血酶结合剂
我们使用具有3Z接头的5聚体阵列文库,然后为具有3Z接头的延伸阵列和取代/缺失文库,以鉴定如表11中所示的凝血酶的肽结合剂。成熟实验在进行中。
表11. 凝血酶结合剂
实施例4. TNFα结合剂
我们使用具有5Z接头的5聚体阵列文库,然后为具有3Z接头的延伸阵列和取代/缺失文库,以鉴定如表12中所示的TNFα的肽结合剂。
表12. TNFα结合剂
实施例5. Taq聚合酶结合剂
我们使用具有5Z接头的5聚体阵列文库,然后为具有3Z接头的延伸阵列和取代/缺失文库,以鉴定如表13中所示的TaqPol的肽结合剂。
表13. TaqPol结合剂
实施例6. 尿激酶样纤溶酶原激活物(uPA)结合剂
我们使用具有5Z接头的5聚体阵列文库,然后为具有3Z接头的延伸阵列和取代/缺失文库,以鉴定如表14中所示的uPA的肽结合剂。
表14. uPA结合剂
我们还研究了接头对使用5聚体文库的结合剂选择的作用。我们发现使用“无接头”5聚体文库代替5Z文库导致选择共享下述模式的大量肽:XNDK[FY] (SEQ ID NO:231)和XSEKFX (SEQ ID NO:232),其中X是20种天然氨基酸中的任一种。选自5Z 5聚体文库的NDKFS (SEQ ID NO:100)和RSEKF (SEQ ID NO:108)基序属于相同的两个组。然而,由于低信号,NAYFS (SEQ ID NO:96)和HETAR (SEQ ID NO:105)在“无接头”文库中将无法检测到。
实施例7. 所选择的链霉抗生物素蛋白结合剂的表征
通过UW Biotechnology中心(Madison, WI)或Peptide2.0 (Chantilly, VA),使用标准的基于柱的合成技术以98-99%的纯度合成表15中列出的链霉抗生物素蛋白肽结合剂的选择。Strep-标签II肽NH2-SAWSHPQFEK-COOH购自IBA GmbH(Goettingen,德国)。值得注意的是,如表15所示用C末端酰胺或羧酸(-COOH)部分制备肽。然后通过表面等离子体共振(SPR)表征合成的肽,以鉴定结合特征包括结合速率常数(ka)、解离速率常数(kd)和平衡解离速率常数(kd/ka = KD)。在一个方面,通过使用Biacore X100仪器(GE Healthcare)执行SPR实验。最初,使用Amine Coupling Kit (GE Healthcare),在20℃下,将60 μl在10 mM乙酸钠pH5.0中的100 μg/ml链霉抗生物素蛋白固定至传感器芯片CM5 (GE Healthcare)的流动池2 (Fc2)共6分钟。在水中以5或10 mM浓度制备肽储备溶液,并且在SPR实验之前在HBS-EP+ (GE Healthcare)缓冲液中稀释。使用HBS-EP+作为运行缓冲液和0.2 M NaCl、10 mM NaOH或10 mM HCl-甘氨酸,pH1.7作为再生缓冲液,以多重动力学模式执行肽结合。使用Biacore X100软件计算结合动力学参数。所得到的数据显示于表15中。
表15. 表征的链霉抗生物素蛋白结合剂
使用本文所述的用于肽结合剂鉴定的方法(例如核心基序发现、成熟、延伸)鉴定表15中列出的链霉抗生物素蛋白的肽结合剂。在一个方面,使用根据本发明的用于肽结合剂鉴定的基于阵列的方法未能鉴定肽SAWSHPQFEK (SEQ ID NO:233),但是其为能够结合经改造的链霉抗生物素蛋白的已知的Strep-Tag II融合标签序列(NOVAGEN)。Strep-Tag II肽(SEQ ID NO:233)用作用于与表15中列出的剩余肽比较的基准。在另一个方面,使用本发明的方法使Strep-Tag II肽(SEQ ID NO:233)成熟并延伸,以鉴定肽WTHPQFEQK (SEQ ID NO:234)、WTHPQFEQPKA (SEQ ID NO:235)和EWVHPQFEQKAK (SEQ ID NO:236),所述肽各自显示出与Strep-Tag II肽(SEQ ID NO:233)相比较降低的KD。
表15中列出的另外三组肽包括:i) NSFDDWLAKGG (SEQ ID NO:237)和GNSFDDWLASKG (SEQ ID NO:238),ii) ADYLAEYHGG (SEQ ID NO:239)、AFDYLAQYHGG (SEQ ID NO:240)和AFPDYLAEYHGG (SEQ ID NO:241),以及iii) DPAPAWAHGG (SEQ ID NO:242)和RDPAPAWAHGGG (SEQ ID NO:243)。对于每个组,每个分组中的第一个列出的肽序列(亲本肽)被进一步成熟、延伸或其组合,其一般产生具有较低平衡解离常数(KD)的肽结合剂。在一个方面,与亲本肽NSFDDWLAKGG (SEQ ID NO:237)相比较,肽GNSFDDWLASKG (SEQ ID NO:238)显示出不可逆结合。在另一个方面,肽AFPDYLAEYHGG (SEQ ID NO:241)显示出表15中的每种链霉抗生物素蛋白肽结合剂的最低KD。在另一个方面,肽DPAPAWAHGG (SEQ ID NO:242)通过在N末端和C末端各自处的单个氨基酸的延伸产生肽RDPAPAWAHGGG (SEQ ID NO:243),其导致与亲本肽相比较KD的至少100倍变化。
表15中的一种或多种肽可以单独使用或与另一个种类组合使用,以形成具有蛋白质链霉抗生物素蛋白的分子的复合物,其中复合物具有小于约10微摩尔(µM)的KD。在一个方面,与肽结合剂结合的种类可以是另一种肽或蛋白质、具有固体表面的组分例如珠或芯片、小分子、核酸(例如DNA、RNA)等等、及其组合。例如,肽结合剂可以是添加到蛋白质中的N末端或C末端标签。在另一个实例中,肽可以共价(或以其他方式)附着到磁珠。在另一个方面,肽(如上所述单独或与另一个种类组合)可以与链霉抗生物素蛋白形成复合物。在一个实例中,肽-链霉抗生物素蛋白复合物具有小于约100 μM的KD。在另一个实例中,肽-链霉抗生物素蛋白复合物具有小于约10 μM的KD。在另一个实例中,肽-链霉抗生物素蛋白复合物具有小于约1 μM的KD。在再一个实例中,肽-链霉抗生物素蛋白复合物具有小于约0.1 μM的KD。如表15中列出的,肽AFPDYLAEYHGG (SEQ ID NO:241)显示出0.043 μM(即小于约0.1 μM)的测量KD。在另一个方面,肽RDPAPAWAHGGG (SEQ ID NO:243)显示出约4.66 μM(即小于约10 μM)的KD。在另一个方面,肽ADYLAEYHGG (SEQ ID NO:239)显示出约96 μM(即小于约100 μM)的KD。另外的肽结合剂和关于与链霉抗生物素蛋白形成的复合物的相关KD在表15中列出。
本文链接: http://zeonchem.immuno-online.com/view-751887.html