Protein

Protein accession
A0AA49X3I8 [UniProt]
Representative
7quCP
Source
UniProt (cluster: phalp2_38208)
Protein name
Minor tail protein
Lysin probability
100%
PhaLP type
VAL
Probability: 99% (predicted by ML model)
Protein sequence
KRQLNIANMAFQSTEKSTSSYKNYLNQLNTVIQKHQNTIRVLEGRYQKVAREQGVMSKEALELKEKILQEKATLGQLDNQYKKTTIEAKRFAFEQKTLTASMSEIRQKMSQVSQSLTISANKFKMSGQTAQAYKARISELNNGMKQQQLIVQNLSRQYDFAKKQYGATSQEAQQLNVKLSEERLKLKELNTQINQTTQAHNRLEMEQKQGISSMTQIRAKMSQFNDTLSLSRSNLSRAGESVKAYGNHLNVLKTNMSEQRVVLRELIAQYNHVANAQGRDSQEARELSSAITQQKIKMNELESELDQTTQSYKQLETEQRNAQRLASSGFGRSIQSVNKYKDSIRNVGSTMRSVGSTSMLYMTMPAVAGMGTAIKSSIDWEQALAGVAKTTNMSGSELNKMGNEITKMSNTMPFAATEIAGVAEAAGQLGIKKQDITSFTKTMMNLGVATNLTADEAATEFARFANAANMPIKDVDRLGSTVVALGNSTATTEKEIVEMAQRLAGAGAQAGFSSDEIMSVSAAMSSVGIEAEAGGTAMTQIWNKMTKAVAEGGDTLDSFAKTAGVSGKEFAQIWENNPSKALSMFVKGLGETEGGAKGVLKALDDVGIKGIREADTIRRMANNHQVLDKALKTGSEGWKENSALTNEANIRYETMGSKLKMLKNTFINFARTIGDAVAPIVSFLADKLTGLFEHLQGTSNSTKIAIAAFTLLGAAIPPLIVATGVLAHSIVGISEAMTLLNATKGGAKFFSLFNGGIKGVLPNIAQLLTEIPLIGGLMTALTGPVGIAVAAIAGIGTAFVVAYKKSETFRNIVNTVVTPIKNAFIGLGNVIKQFFSAIGAIMNNNSGKGLNILKKILPDEAAKQFYSTLLMVRGAYNDFVNFIKTTSTIIGAFFKTFWKQNGDFIITVFTTIKIAVGSILNSLFNGVIKPILSGIKAFFGIIFGGIKQIVINVFTSLREIVQGGLNVIRGVIKIFKGLFTGDFRLLWEGVKQVFSGYLSIISGILRSTLGNMVVIVKTIGQLIINSFRTIWTIVKNVTLGIVKVLVATIKFLFTGLKNVIVAILNGIKNISIAIWTAIKSSVLVIIRSLVALAKNSFSTLKGFLSALWTSIKNTAIKLWTALKIGVLAIVRTLVSTARNILNTLKNFITRLWQSIKAISIRVWNAIKNSVINIIKGMYNGIRKILAGLKAFITRTWTAIKNTTVKLAKGLSSGVKNVFNSLSKVTRSIFNKLKAFMSNVWRSIKNTTVKLAKGLWSGVKAIWNALSRFTRSVFNKLKNFMSSVWRNIKNTTVRLAKALWSGVKNTFNSLYNGTKRIFNKLKNFMSNIWRNIKNTTVRLAKSLWSGVKSTWNSLSNGTRNIFNKVKSFMSNTWRSIKNTTVNMAKGLWNSVRRTFNNMNGGLKNIIGKIKGHITGMVTAVKEGLNKLIGGVNWVAGKLDMPKLPEIKLSTGTESTHTQSYITKGKLNRNTLATVGDKGPGNGPGGFRHETVIPPSGKAFITPATDTTIPLAKGTRILNGAQTHSLLNRPQFNDGTIPKFSLGTTFANLLGGGKKPKKHKKDDDLVGDVAQKTKDGVKAMTGKVVEGGKAVVGSALNTAKKGKDWLSDKIGDVLDWIEKPKKLLEKVFEGFGISMASFGIPKSAELPFNLMKGMFKKLKEGAVNKVKEWFEEAGGGDGGYIDLSKGVNFGFAPTTAAARAAGYPFARPHFGLDINYKHDKVYSTMSGTARTFNGWSGGFGRHVEITNGNLKSIYGHLHKLAFNGTKKVRPGTLLGVSGGDPREDGQNAGSSTGLHLHYEMQRNGRAFDPTKWLKTHNGGGKSGGKQAPSKWRSTIVRAARKMKVNPTNAQINGIIAQIQRESGGDSGIIQSASLHDGNEGPNRARGLLQYVPSTFASYSVAGHKNINSGYDQLLAFFNNSNWKNDIQYGRSGWGPRGSRRFATGGLIKSAGWYNIAEGGYPEWIIPTDPARRSDAMKMLALAAQDIDKKSSTRGNKRPNNLKAPNNLYSSNNDELLLQMIEQQQQQINLLMEIARSNRGIENKEMEVNLDGKSLNKNNNKHQALNNATRLMGGR
Physico‐chemical
properties
protein length:2072 AA
molecular weight:225980,2 Da
isoelectric point:10,20
hydropathy:-0,21
Representative Protein Details
Accession
7quCP
Protein name
7quCP
Sequence length
841 AA
Molecular weight
91339,81810 Da
Isoelectric point
9,55855
Sequence
MAEQYEGVTIKLGLNTANIDRGMQALSRKMKTLNSEMKSHLSAFDMAEKSSDKYNGKIKILNKQLETQGQKVASAENKLKSLKDEQTKANEKIAESSQKLKAEKATLDTLNQTLSRHNSKLNQTKAAYDKADADLKRYKSDLDLLKAKHQEAGASVKTLKNKLTELTNSNKQNTAEFKRTQAQLNVVESEYKQLGAEVDKANLKYRSQRKTVEETKQAHQKMSQTVDKETQQLKVDIKEQEKVVNGAEQAHQKLQKRIGGLPASIDKAEKAVHQEKATFNSLQRQLKNTEAEYERYKQENSRTAQVTNRAKEAISALTTQLKRSLNQFKATGSSVSSYQTRINDLKNAHTQLKNNIAMLNHEHRRLSGEQGRNSEVARKLADKINVEKIKMNELSTQIKQTEGSLKEFEREQKIAASLSATPAGRAVQSINKYQDRLRDTANTMKSVGRTSMIYMTTPIVAGMGGAVKASIDWEDALTGVAKTTDMTGKELSNMGDKITDMSNKMPFAANEIAGVAEAAGQLGVKKSSILDFTKTMMDLSVATNMTADEAATQFAKFANAAGMPIDNVDRLGSAVVNLGNNTATTEKDIVNMGQRLAGAGAQAGFSADEIMSIAAAMSSVGIEAEAGGTAMTQIFNKMTKAAASGGDELKGFAKTSGMSAEQFAQTWENNPTKALSAFVKGLGNTKGGAKGVQKALEQVGISGIREADTVRRMANNHKVLDDALKVGSEGWKENNALTNEAQQRYDTLKSKLIVLKNNFVNFGKEIGATLEPILTPIINKLSDVFKGFQGASKGTKLFVVGLGGLAAVLPPIIFLAGSFAGALLNITKVLTGIPKMASVFS
Other Proteins in cluster: phalp2_38208
Total (incl. this protein): 6 Avg length: 1859,2 Avg pI: 10,04

Protein ID Length (AA) pI
7quCP 841 9,55855
A0A4P6R4F6 2031 10,06585
A0A499SIL1 2031 10,03974
Q4ZD65 2008 10,16952
A0A2H4J8X5 2172 10,18376
Similar Clusters (pHMM search)
# Cluster # Members Identity (%) Alignment Length E-value
1 phalp2_38730
11Bbs
19 30,7% 533 4.007E-50

Domains

Domains [InterPro]

No domain annotations available.

Taxonomy

  Name Taxonomy ID Lineage
Phage Staphylococcus phage HS12
[NCBI]
3056402 No lineage information
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
CDS Source ID
CDS Source
OQ890318 [NCBI]
CDS location
range 27833 -> >34051
strand -
CDS
AAACGTCAACTTAACATTGCAAATATGGCATTTCAAAGTACAGAAAAATCTACAAGTAGTTATAAGAATTATTTAAATCAACTCAACACCGTTATTCAAAAACATCAAAATACAATTAGAGTATTAGAAGGACGTTATCAAAAGGTTGCTAGAGAACAAGGTGTTATGAGTAAAGAAGCGTTAGAGTTAAAAGAGAAGATTTTACAAGAAAAAGCAACTTTAGGGCAACTAGACAATCAATATAAGAAAACGACTATAGAAGCGAAACGTTTTGCTTTTGAACAAAAAACTTTAACTGCTTCAATGTCTGAAATTCGACAAAAAATGTCGCAGGTATCACAATCTTTAACAATTAGTGCTAATAAATTCAAAATGAGTGGTCAAACTGCTCAAGCATATAAAGCACGCATTTCTGAATTGAACAACGGAATGAAACAACAGCAACTTATTGTTCAAAATTTATCAAGACAGTATGACTTTGCTAAAAAGCAATACGGTGCTACAAGTCAAGAAGCACAACAACTTAATGTAAAGTTATCAGAAGAACGTTTGAAATTAAAAGAGTTAAACACTCAAATAAACCAAACAACACAAGCACATAACCGTTTAGAAATGGAACAAAAACAGGGCATTTCTTCTATGACTCAAATTAGAGCGAAGATGTCACAGTTTAACGATACTCTATCTCTATCAAGAAGTAATCTTTCGCGTGCAGGAGAGAGTGTAAAAGCCTATGGTAATCATTTAAATGTACTTAAAACGAATATGTCTGAACAACGTGTCGTATTAAGAGAATTAATCGCACAATATAATCATGTGGCTAATGCACAAGGACGTGATAGTCAAGAGGCAAGAGAACTATCTAGCGCAATCACTCAACAAAAAATTAAGATGAACGAACTTGAGAGTGAGTTAGACCAAACAACGCAAAGTTATAAACAATTAGAAACAGAACAACGAAACGCGCAACGTTTAGCATCTAGTGGGTTTGGTAGAAGTATTCAAAGCGTTAATAAGTATAAAGATTCAATTAGAAACGTAGGCTCTACTATGAGAAGTGTAGGATCTACTTCAATGCTTTATATGACTATGCCAGCAGTTGCAGGCATGGGGACAGCTATAAAATCTTCTATTGATTGGGAACAAGCTTTAGCAGGTGTTGCTAAAACAACTAATATGAGTGGTAGCGAATTAAATAAAATGGGCAATGAGATTACTAAAATGAGTAATACAATGCCATTCGCTGCAACAGAAATAGCAGGAGTAGCAGAAGCTGCAGGACAACTAGGGATCAAGAAACAGGATATCACTTCATTCACTAAAACAATGATGAATTTAGGTGTAGCTACAAACCTTACTGCAGATGAAGCAGCAACAGAGTTTGCAAGATTTGCTAATGCTGCAAATATGCCAATCAAAGATGTAGATAGATTAGGTTCAACAGTTGTTGCTTTAGGTAATAGTACAGCCACAACTGAAAAAGAAATTGTTGAAATGGCACAACGTTTAGCTGGTGCAGGCGCACAAGCAGGTTTTAGTTCTGATGAAATTATGTCAGTCAGTGCAGCGATGTCATCAGTAGGAATCGAGGCAGAAGCTGGCGGTACTGCCATGACACAAATTTGGAATAAGATGACCAAAGCTGTTGCCGAAGGTGGCGACACTTTAGATAGCTTCGCTAAAACTGCAGGCGTTAGTGGTAAAGAATTTGCACAAATCTGGGAGAATAACCCAAGTAAAGCATTATCAATGTTCGTTAAAGGTTTAGGCGAAACTGAAGGTGGAGCAAAAGGAGTATTAAAAGCCTTAGACGATGTAGGTATCAAAGGGATAAGAGAAGCCGATACTATTAGACGTATGGCTAACAATCATCAAGTTCTAGATAAAGCACTTAAAACAGGCTCAGAAGGTTGGAAAGAAAATAGTGCTTTAACTAATGAAGCTAACATCCGTTATGAAACAATGGGTAGTAAGTTGAAAATGTTAAAAAACACTTTCATCAACTTTGCTAGAACAATTGGAGATGCAGTTGCACCTATCGTTTCATTCTTAGCAGATAAGTTGACAGGCTTATTCGAACACTTACAAGGAACAAGTAATTCTACTAAGATAGCAATTGCAGCATTTACTTTATTAGGTGCTGCTATACCTCCACTTATTGTTGCAACTGGTGTATTAGCACATAGTATCGTAGGTATCTCAGAAGCTATGACATTACTTAATGCTACTAAAGGCGGTGCTAAATTCTTTAGCCTATTTAACGGTGGTATTAAAGGCGTTTTACCTAATATAGCGCAACTACTTACTGAGATACCTTTAATTGGCGGACTAATGACTGCATTAACAGGTCCAGTTGGTATCGCAGTTGCAGCTATTGCAGGAATAGGGACAGCCTTTGTGGTTGCTTATAAAAAATCAGAAACATTTAGAAATATCGTCAATACAGTAGTCACACCAATAAAAAATGCGTTTATTGGTTTAGGAAATGTAATTAAACAATTCTTTAGTGCAATCGGCGCTATTATGAATAATAATTCTGGGAAAGGTTTAAACATTCTCAAAAAGATATTACCTGATGAAGCAGCAAAACAATTTTATTCTACTCTTTTAATGGTACGTGGTGCTTACAATGATTTTGTTAACTTCATAAAAACAACATCTACTATTATCGGTGCTTTCTTTAAAACATTTTGGAAACAAAATGGCGATTTTATTATCACGGTATTTACTACTATCAAGATTGCAGTAGGCTCAATTTTGAATTCGCTATTTAATGGTGTAATTAAACCAATATTATCGGGTATAAAAGCTTTCTTTGGTATTATATTCGGTGGTATTAAACAAATTGTCATCAATGTGTTCACTAGCTTACGTGAAATAGTCCAAGGTGGACTTAATGTCATTCGTGGCGTTATTAAAATATTCAAAGGTTTGTTTACAGGAGACTTTAGGCTTTTATGGGAAGGTGTAAAACAAGTATTTAGTGGATACTTATCAATTATTTCGGGCATATTACGTTCTACACTCGGTAATATGGTGGTTATTGTTAAAACTATCGGACAATTGATCATTAATTCTTTTAGAACAATATGGACGATAGTAAAAAATGTAACGCTTGGAATAGTTAAAGTGTTAGTAGCCACTATTAAATTTTTATTTACTGGATTAAAAAATGTTATAGTTGCTATTCTTAATGGAATTAAAAATATTTCCATTGCAATTTGGACTGCAATTAAAAGTAGTGTATTAGTAATCATTCGAAGCCTCGTAGCTTTAGCAAAAAATAGTTTCTCAACTTTAAAAGGTTTTCTATCTGCATTGTGGACAAGTATCAAAAACACTGCTATTAAATTATGGACTGCCTTAAAAATTGGAGTGCTAGCCATTGTTCGAACATTGGTCAGCACAGCTAGAAACATCCTTAATACGTTGAAAAACTTCATCACTCGTCTATGGCAAAGTATTAAAGCAATATCTATCAGAGTATGGAATGCTATTAAAAATAGCGTTATTAATATTATTAAAGGTATGTATAATGGTATTCGAAAAATATTAGCTGGCTTGAAAGCTTTTATTACAAGAACTTGGACTGCTATTAAAAATACAACAGTAAAACTCGCTAAAGGTTTAAGTAGTGGTGTTAAAAATGTATTTAATAGTTTGTCTAAAGTAACACGTAGTATCTTTAATAAATTAAAAGCTTTCATGTCTAACGTATGGCGTAGTATCAAGAATACTACTGTCAAACTTGCTAAAGGTCTGTGGTCAGGTGTAAAAGCTATATGGAATGCCTTATCGCGATTTACACGTAGCGTATTCAATAAACTCAAGAATTTTATGAGTAGTGTTTGGCGTAATATTAAAAACACAACAGTAAGATTAGCTAAGGCGTTATGGTCTGGCGTTAAAAATACGTTTAATAGTTTATACAATGGTACTAAAAGAATTTTTAATAAACTTAAAAACTTTATGAGTAATATTTGGCGTAACATCAAGAATACAACAGTGCGATTAGCGAAATCTTTATGGAGTGGCGTTAAAAGTACTTGGAATAGTTTATCAAATGGAACGCGTAATATTTTTAACAAAGTTAAAAGTTTTATGTCTAACACTTGGAGAAGTATCAAGAATACAACAGTTAACATGGCTAAAGGTTTATGGAATAGTGTTCGAAGAACATTCAATAATATGAATGGTGGACTTAAAAACATTATTGGAAAAATCAAAGGTCATATTACTGGAATGGTTACGGCTGTTAAAGAAGGTCTAAACAAATTAATTGGCGGTGTGAACTGGGTAGCTGGAAAATTAGATATGCCTAAGTTACCTGAAATAAAACTCTCTACTGGTACTGAAAGCACCCATACTCAAAGTTATATTACGAAAGGTAAACTTAATCGAAACACTTTAGCTACCGTTGGAGATAAAGGTCCAGGCAATGGTCCAGGTGGTTTTAGACATGAAACAGTCATTCCGCCTAGCGGTAAGGCTTTCATCACACCAGCTACAGATACAACAATTCCACTTGCCAAAGGAACTCGTATTTTAAATGGCGCACAAACGCATAGTTTACTTAATAGACCACAATTTAACGACGGTACAATACCGAAATTTAGTTTAGGCACAACATTCGCCAATTTACTTGGCGGTGGTAAAAAACCAAAAAAACATAAAAAAGATGACGATTTAGTGGGTGACGTAGCTCAAAAAACTAAAGACGGCGTTAAAGCTATGACTGGTAAAGTTGTAGAAGGTGGAAAAGCAGTCGTTGGTAGCGCATTGAACACTGCTAAAAAAGGCAAAGATTGGCTATCTGATAAAATTGGCGATGTACTAGATTGGATAGAAAAGCCAAAAAAATTATTAGAAAAAGTATTTGAAGGTTTCGGTATTAGCATGGCTTCATTTGGCATACCTAAAAGCGCTGAATTACCATTTAACCTTATGAAAGGTATGTTTAAAAAACTAAAAGAGGGAGCCGTTAATAAAGTTAAAGAATGGTTTGAAGAAGCTGGCGGTGGTGACGGAGGTTATATTGACCTTTCAAAAGGTGTTAACTTCGGCTTTGCGCCAACAACAGCAGCAGCAAGAGCAGCTGGTTATCCGTTCGCACGACCACACTTTGGACTAGACATAAATTATAAACACGATAAAGTTTATTCTACTATGTCAGGTACAGCTAGAACATTTAACGGTTGGAGTGGTGGTTTTGGTAGACACGTCGAAATCACTAACGGTAATTTGAAATCAATTTATGGCCATTTACACAAATTAGCGTTCAATGGTACTAAAAAAGTAAGACCGGGTACACTTTTAGGCGTATCCGGTGGCGACCCTAGAGAGGACGGACAAAACGCTGGTAGTTCAACAGGACTTCATTTACATTATGAAATGCAAAGAAACGGTAGAGCGTTCGACCCTACTAAATGGCTAAAAACACATAACGGCGGTGGTAAATCAGGTGGCAAACAAGCACCAAGCAAATGGCGTTCAACCATTGTAAGAGCAGCTCGAAAAATGAAAGTAAACCCTACAAACGCACAAATTAATGGTATTATCGCACAAATTCAACGTGAAAGTGGCGGGGACAGCGGTATTATTCAGAGTGCTTCATTGCATGACGGAAATGAAGGTCCGAACAGAGCAAGAGGTTTACTACAATACGTGCCTAGTACGTTTGCTAGTTATTCAGTGGCAGGTCATAAAAACATCAATAGTGGTTACGATCAACTACTTGCGTTCTTTAATAATTCAAACTGGAAAAACGATATTCAGTATGGTCGTAGTGGTTGGGGACCACGTGGTTCAAGACGTTTCGCCACAGGTGGCTTAATCAAATCTGCAGGTTGGTACAACATAGCAGAAGGAGGTTATCCTGAGTGGATAATTCCAACTGATCCAGCTAGACGTAGCGATGCTATGAAAATGTTAGCACTTGCAGCACAAGATATAGATAAGAAAAGTAGCACTAGAGGAAATAAACGACCTAATAACTTAAAAGCACCAAATAACCTTTATTCAAGTAATAATGATGAATTATTACTACAAATGATTGAACAACAGCAACAACAAATTAATTTATTAATGGAAATTGCTAGAAGTAATAGAGGTATCGAGAATAAAGAAATGGAAGTCAATTTAGATGGTAAAAGTTTAAATAAAAACAATAATAAACATCAAGCATTAAATAATGCTACAAGATTAATGGGAGGTAGATAA

Gene Ontology

Description Category Evidence (source)
GO:0016020 membrane cellular component None (UniProt)

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

No tertiary structures available for this protein.

The structures below correspond to the cluster representative (7quCP) rather than this protein.
PDB ID
7quCP
Method AlphaFoldv2
Resolution 76.22
Chain position -
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50