Numbers indicate amino acid counts
POL Gene Regions
| Sequence | Signal Peptide | Protease | Reverse Transcriptase | Integrase
| B.FR.HXB2r | 1 - 55 | 56 - 155 | 156 - 715 | 716 - 1003
| |
Sequence Length
| Sequence | ENV | POL
| B.FR.HXB2r | 876 | 1003
| |
Alignment of POL reference sequences Query file: 5 sequences Maximum sequence length recorded: 1003 CONSENSUS FFREdLAFlQ GKAREfSSEQ TRANSPTRrE LQVWGrdnnS lSEAGaDRQG tVSFnFPQiT LWQRPlVTik IGGQLKEALL DTGADDTVLE eMnLPGkWKP B.FR.HXB2r ----D---L- -----F---- --------R- -----RDNN- P----A---- T---N---V- -----L--IK ---------- ---------- E-S---R--- B.US.SF2 ----D---L- -----F---- --------R- -----GENN- L----A---- T---N---I- -----L--IR ---------- ---------- E-N---K--- B.US.JRFL ----D---L- -----F---- --------K- -----RDSN- L----A---- N---N---I- -----L--IK ---------- ---------- D-D---R--- B.US.RF ----N---P- -----L---- --------R- -----RDN.- L----E---- T---S---I- -----I--VK ---------- ---------- E-N---K--- 100 CONSENSUS KMIGGIGGFI KVRQYDQIli EICGHKAIGT VLVGPTPVNI IGRNLLTQIG CTLNFPISPI ETVPVKLKPG MDGPKVKQWP LTEEKIKALV EICTEMEKEG B.FR.HXB2 ---------- --------LI ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- B.US.SF2 ---------- --------PV ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- B.US.JRFL ---------- --------LI ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- B.US.RF ---------- --------LI ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- 200 CONSENSUS KISKIGPENP YNTPVFAIKK KDSTKWRKLV DFRELNKrTQ DFWEVQLGIP HPAGLKKkKS VTVLDVGDAY FSVPLDkdFR KYTAFTIPSI NNETPgIRYQ B.FR.HXB2 ---------- ---------- ---------- -------R-- ---------- -------K-- ---------- ------ED-- ---------- -----G---- B.US.SF2 ---------- ---------- ---------- -------R-- ---------- -------K-- ---------- ------KD-- ---------- -----G---- B.US.JRFL ---------- ---------- ---------- -------K-- ---------- -------R-- ---------- ------KD-- ---------- -----G---- B.US.RF ---------- ---------- ---------- -------R-- ---------- -------K-- ---------- ------KE-- ---------- -----R---- 300 CONSENSUS YNVLPQGWKG SPAIFQSSMT KILEPFrKQN PdIvIYQYMD DLYVGSDLEI GQHRtKIEEL RqHLLrWGfT TPDKKHQKEP PFLWMGYELH PDKWTVQPIv B.FR.HXB2 ---------- ---------- ------R--- -D-V------ ---------- ----T----- -Q---R--L- ---------- ---------- ---------V B.US.SF2 ---------- ---------- ------R--- -D-V------ ---------- ----T----- -Q---R--F- ---------- ---------- ---------M B.US.JRFL ---------- ---------- ------R--- -D-I------ ---------- ----A----- -Q---R--F- ---------- ---------- ---------V B.US.RF ---------- ---------- ------K--- -E-V------ ---------- ----I----- -E---K--F- ---------- ---------- ---------V 400 CONSENSUS LPEKDSWTVN DIQKLVGKLN WASQIYaGIK VkQLCKLLRG TKALTEVipL TeEAELELAE NREILKEPVH gVYYDPSKDL iAEiQKQGQG QWTYQIYQEP B.FR.HXB2 ---------- ---------- ------P--- -R-------- -------IP- -E-------- ---------- G--------- I--I------ ---------- B.US.SF2 ---------- ---------- ------A--- -K-------- -------IP- -E-------- ---------- E--------- V--I------ ---------- B.US.JRFL ---------- ---------- ------A--- -K-------- -------IP- -E-------- ---------- G--------- I--L------ ---------- B.US.RF ---------- ---------- ------A--- -K-------- -------VQ- -K-------- ---------- G--------- I--I------ ---------- 500 CONSENSUS FKnLKTGKYA RmRGAHTNDV KQLTEAVQKv atESIVIWGK tPKFKLPIQK ETWEaWWtEY WQATWIPEWE FVNTPPLVKL WYQLEKEPIv GAETFYVDGA B.FR.HXB2 --N------- -M-------- ---------I TT-------- T--------- ----T--T-- ---------- ---------- ---------V ---------- B.US.SF2 --N------- -M-------- ---------V ST-------- I--------- ----A--M-- ---------- ---------- ---------V ---------- B.US.JRFL --I------- -T-------- ---------I AN-------- I--------- ----T--T-- ---------- ---------- ---------V ---------- B.US.RF --N------- -M-------- ---------V AT-------- T--------- ----A--T-- ---------- ---------- ---------I ---------- 600 CONSENSUS ANRETKLGKA GYVTdRGRQK VVsltDTTNQ KTELQAIhLA LQDSGLEVNI VTDSQYALGI IQAQPDkSES ELVsQIIEQL IKKEKVYLAW VPAHKGIGGN B.FR.HXB2 ---------- ----N----- --TLT----- -------Y-- ---------- ---------- ------Q--- ---N------ ---------- ---------- B.US.SF2 ---------- ----D----- --SIA----- -------H-- ---------- ---------- ------K--- ---S------ ---------- ---------- B.US.JRFL ---------- ----N----- --SLT----- -------H-- ---------- ---------- ------K--- ---S------ ---------- ---------- B.US.RF ---------- ----D----- --SLT----- -------H-- ---------- ---------- ------K--- ---S------ ---------- ---------- 700 CONSENSUS EQVDkLVSaG IRKVLFLdGI DKAQdeHEKY HSNWrAMASD FNLPPVVAKE IVASCDKCQL KGEAMHGQVD CSPGIWQLDC THLEGKiILV AVHVASGYIE B.FR.HXB2 ----K---A- -------D-- ----DE---- ----R----- ---------- ---------- ---------- ---------- ------V--- ---------- B.US.SF2 ----K---A- -------N-- ----EE---- ----R----- ---------- ---------- ---------- ---------- ------I--- ---------- B.US.JRFL ----K---A- -------D-- ----ED---- ----K----- ---------- ---------- ---------- ---------- ------I--- ---------- B.US.RF ----R---T- -------D-- ----DE---- ----R----- ---------- ---------- ---------- ---------- ------I--- ---------- 800 CONSENSUS AEVIPAETGQ ETAYFlLKLA GRWPVKtIHT DNGSNFTstT VkAACWWAGI KQEFGIPYNP QSQGVVESMN keLKkIIGQV RDQAEHLKTA VQMAVFIHNF B.FR.HXB2 ---------- -----L---- ------T--- -------GA- -R-------- ---------- ---------- KE--K----- ---------- ---------- B.US.SF2 ---------- -----L---- ------T--- -------ST- -K-------- ---------- ---------- NE--K----- ---------- ---------- B.US.JRFL ---------- -----L---- ------T--- -------ST- -K-------- ---------- ---------- KE--K----- ---------- ---------- B.US.RF ---------- -----I---- ------V--- -------ST- -K-------- ---------- ---------- KQ--Q----- ---------- ---------- 900 CONSENSUS KRKGGIGGYS AGERIVDIIA TDIQTKELQK QITKIQNFRV YYRDsrdPLW KGpAKLLWKG EGAVVIQDNS DIKVVPRRKa KIIRDYGKQM AGDDCVASRQ B.FR.HXB2 ---------- ---------- ---------- ---------- ----SRN--- --P------- ---------- ---------A ---------- ---------- B.US.SF2 ---------- ---------- ---------- ---------- ----NKD--- --P------- ---------- ---------A ---------- ---------- B.US.JRFL ---------- ---------- ---------- ---------- ----SRE--- --P------- ---------- ---------V ---------- ---------- B.US.RF ---------- ---------- ---------- ---------- ----SRD--- --H------- ---------- ---------A ---------- ---------- 1000 CONSENSUS DED B.FR.HXB2 --- B.US.SF2 --- B.US.JRFL --- B.US.RF ---
Alignment of Envelope reference sequences Query file: 5 sequences Maximum sequence length recorded: 876 CONSENSUS MrVke?rkny QhL????W?w GT?LLGmLMI CSAtEkLWVT VYYGVPVWKE ATTTLFCASd AkAYdTEVHN VWAtHACVPT DPNPQEVvLe NVTEnFNMWK B.FR.HXB2r -R-KE..K.Y -H-WRWG-RW --M---M--- ---T-K---- ---------- ---------D -K--D----- ---T------ -------V-V ----N----- B.US.SF2 -K-KGTRRNY -H-....-RW --L---M--- ---T-K---- ---------- ---------D -R--D----- ---T------ -------V-G ----N----- B.US.JRFL -R-KGIRKSY -Y-....-KG --L---I--- ---V-K---- ---------- ---------D -K--D----- ---T------ -------V-E ----H----- B.US.RF -R-MEMRKNC -H-....-KW --M---M--- ---A-D---- ---------- ---------E -K--K----- ---K------ -------L-E ----N----- 100 CONSENSUS NnMVEQM?ED IISLWDQSLK PCVKLTPLCV tLnCtDl?na tntnsss?g? ??mekGEIKN CSFnitTSiR dkvQKeyAlF ykLDvvPIdn ?????????? B.FR.HXB2 -D-----H-- ---------- ---------- S-K-T-LKND TNTNSSS.GR MIMEK----- ---NIS--I- GKV--EY-F- YK--II--DN .......... B.US.SF2 -N-----Q-- ---------- ---------- T-N-T-LGKA TNTNSS..NW KEEIK----- ---NIT--I- DKI--EN-L- RN--VV--DN ........AS B.US.JRFL -N-----Q-- ---------- ---------- T-N-K-.VNA TNTTNDS..E GTMER----- ---NIT--I- DEV--EY-L- YK--VV--DN .......... B.US.RF -N-----H-- ---------- ---------- T-N-T-ANLN GTNVTSSSGG TMMEN----- ---QVT--R- DKT--KY-L- YK--VV--EK GNISPKNNTS 200 CONSENSUS ???nyt?YrL i?CntSVITQ ACPKvSFEPI PIHYC?PAGF AILKCN?KtF NG?GPC?NVS TVQCTHGIRP vVSTQLLLNG SLAEEEVVIR SdNFT?NaKT B.FR.HXB2 ...DTTS-K- TS-NT----- ----V----- -----A---- ------N-T- --T---T--- ---------- V--------- ---------- -V---D-A-- B.US.SF2 TTTNYTN-R- IH-NR----- ----V----- -----T---- ------N-T- --K---T--- ---------- I--------- ---------- -D---N-A-- B.US.JRFL ...NNTS-R- IS-DT----- ----I----- -----A---- ------D-T- --K---K--- ---------- V--------- ---------- -D---N-A-- B.US.RF NNTSYGN-T- IH-NS----- ----V----- -----T---- ------D-K- --T---K--- ---------- V--------- ---------- -E---D-V-- 300 CONSENSUS IIVQLneSVe INCTRPNNNT RK??sI?iGP GRafyttg?i IGdiR?AHCN iSRA?WNnTL kQiv?KLREQ FgN?KTIvFn qSSGGDPEIV mHSFNCgGEF B.FR.HXB2 -----NT--E ---------- --RIR-QR-- --AFVT.IGK --NM-Q---- I---K--N-- K-IAS----- -G-N---I-K Q--------- T-----G--- B.US.SF2 -----NE--A ---------- --..S-YI-- --AFHTTGRI --DI-K---- I---Q--N-- E-IVK----- -G-N---V-N Q--------- M-----R--- B.US.JRFL -----KE--E ---------- --..S-HI-- --AFYTTGEI --DI-Q---- I---K--D-- K-IVI----- -E-.---V-N H--------- M-----G--- B.US.RF -----NA--Q ---------- --..S-TK-- --VIYATGQI --DI-K---- L---Q--N-- K-VVT----- -D-.---V-T S--------- L-----G--- 400 CONSENSUS FYCN?TQLFN sTW????nst egsnnTeGnd TItLPCRIKQ IiNMWQeVGK AMYAPPIsGQ IrCsSNITGL LLTRDGG?n? tN?tEiFRpG GGdMRDNWRS B.FR.HXB2 ----S----- S--FNSTWST EGSNN-E-SD --T------- -I----K--- -------S-- -R-S------ -------.NS N-ES-I--P- --D------- B.US.SF2 ----T----- N--.....RL NHTEG-K-ND --I------- -I----E--- -------G-- -S-S------ -------TNV T-DT-V--P- --D------- B.US.JRFL ----S----- S--...NNNT EGSNN-E-N. --T------- -I----E--- -------R-- -R-S------ -------.IN E-GT-I--P- --D------- B.US.RF ----T----- S--....NST EGSNN-G-ND --T------- -V----E--- -------S-- -K-I------ -------EDT T-TT-I--L- --N------- 500 CONSENSUS ELYKYKVvkI EPLGvAPTkA KRRVVQREKR AVGi?GAmFL GFLGAAGSTM GAaSmTLTVQ ARqLLSGIVQ QQNNLLRAIE AQQhlLQLTV WGIKQLQARv B.FR.HXB2 -------VK- ----V---K- ---------- ---I.--L-- ---------- --A-M----- --Q------- ---------- ---HL----- ---------I B.US.SF2 -------IK- ----I---K- ---------- ---IV--M-- ---------- --V-L----- --Q------- ---------- ---HL----- ---------V B.US.JRFL -------VK- ----V---K- ---------- ---I.--V-- ---------- --A-M----- --L------- ---------- ---RM----- ---------V B.US.RF -------VR- ----V---R- ---------- ---TI--M-- ---------- --G-I----- --H------- ---------- ---HL----- ---------V 600 CONSENSUS LAVERYLrDQ QLLGIWGCSG KLICTTaVPW NASWSNKSLe ?IWnnmTWM? WeREIdNYTs ?IytL?EESQ NQQEKNEQEL LELDKWAsLW NWFdITnWLW B.FR.HXB2 -------K-- ---------- ------A--- ---------E Q--NHT---E -D---N---S L-HS-I---- ---------- -------S-- ---N--N--- B.US.SF2 -------R-- ---------- ------A--- ---------E D--DNM---Q -E---D---N T-YT-L---- ---------- -------S-- ---S--N--- B.US.JRFL -------G-- ---------- ------A--- ---------D R--NNM---E -E---D---S E-YT-I---- ---------- -------S-- ---D--K--- B.US.RF -------R-- ---------- ------T--- ---------N M--NNM---Q -E---D---G I-YN-L---- ---------- -------N-- ---D--Q--- 700 CONSENSUS YIkiFIMIVG GLVGLriVFa VLSIVNRVRQ GYSPLSFQTh LPaPRGPDRP eGIEeEGGER DRDRSgrlVn GfLaLIWdDL rsLClFSYhR LRDLLLivtR B.FR.HXB2 --KL------ -----RI--A ---------- ---------H --T------- E---E----- -----IRL-N -S-A---D-- RS--L---H- ------IVT- B.US.SF2 --KI------ -----RI--A ---------- ---------R --V------- D---E----- -----VRL-D -F-A---E-- RS--L---R- ------IAA- B.US.JRFL --KI------ -----RL--T ---------- ---------L --A------- E---E----- -----GRL-N -F-A---V-- RS--L---H- ------TVT- B.US.RF --RI------ -----KI--A ---------- ---------H --A------- E---G----- -----GGA-N -F-T---D-- WT--S---H- ------IVV- 800 CONSENSUS iVElLGrRGWEaLKYWWnLLQYWsQELKNSAVSlLNaTAIAVaEGTDR?IEvaQrayRAilHIprRIRQGLERaLL B.FR.HXB2 I--L--R----A-----N-----S---------L--A-----A-----V--VV-GAC--IR--PR--------I-- B.US.SF2 T--I--H----A-----S-----I---------W--A-----T-----V--VA-RAY--IL--HR--------L-- B.US.JRFL I--L--R----V-----N-----S---------L--A-----A-----I--AL-RTY--IL--PT--------A-- B.US.RF I--L--R----A-----N-----S---------L--T-----A-----I--VA-RIL--FL--PR--------A--