Protein

Protein accession
A0A2H4J8X5 [UniProt]
Representative
7quCP
Source
UniProt (cluster: phalp2_38208)
Protein name
Lysostaphin
Lysin probability
100%
PhaLP type
VAL
Probability: 99% (predicted by ML model)
Protein sequence
MAESRFKGLSILMNMRDVGIERTMKQIRAQFKTLDSEMRRSNANFKHSEKNMQSYATRTKELTKAIDVTENSMKDISNQLKKMTLEEQRSSVEAEKLRQEYSKQHRALQMYQRQLNSTEQEMKQFGTTTKQTIFSMKKINDVLGTMKRQLNIANMAFQSTEKSTSSYKNYLNQLNTVIQKHQNTIRVLEGRYQKVAREQGVMSKEALELKEKILQEKATLGQLDNQYKKTTMEAKRFAFEQKTLTASMSEIRQKMSQVAQSLTISANKFKMSGQTAQAYKARISELNNGMKQQQLIVQNLSRQYDFAKKQYGATSQEAQQLNVKLSEERLKLKELNTQLNQTTQAHNRLEMEQKQGISSMAQIRAKMSQFNDTLSLSRSNLARAGESVKAYGNHLNTLKTNMLEQRVVLKELIAQYNHVATAQGRNSQEARELSSAITQQKIKMNELESELDQTTQSYKRLETEQRNAQRLASSGFGRSIQSVNKYKDSIRNVGSTMRSVGSTSMLYMTMPAVAGIGTAIKSSVDWEQALAGVAKTTNMSGSELNKMGNEITKMSNTMPFAATEIAGVAEAAGQLGIKKQDISSFTRTMMNLGVATNLTADEAATEFARFANAANMPIKDVDRLGSTVVALGNSTATTEKEIVEMAQRLAGAGAQAGFSSDEIMSVSAAMSSVGIEAEAGGTAMTQIWNKMTKAVAEGGDTLDSFAKTAGVSGKEFAQIWENNPSKALSMFVKGLGETEGGAKGVLKALDDVGIKGIREADTIRRMANNHQVLDKALKTGSEGWKENSALTNEANVRYETMGSKLKMLKNTFINFARTIGDAVAPIVSFLADKLTGLFEHLQGTSNATKIAIAAFTLLGVAIPPLIVATGVLAHSIVGISEAMTLLNATKGGAKFFSLFNGGIKGVLPNIAQLLTKIPLIGGLMTALTGPVGIAVAAIAGIGTAFVVAYKKSETFRNIVNAVINPVKNAFIGLWNVIKQFGSGIKAVFSNDTGKGLNIFKKILPDEAARQFTSTLLMIRGAYNDFVNFIKTISVAVGAFFKAFWKENGASIVNAFKVIKVGVTATLTVLYNNIIKPILTGIKNFFSIIFGGLKQIVINTFTGIRMIVQGGLNVIRGIINIFKGLFTGDFSLMWQGIKQVFSGALSVIAGVLRATLGNMLIIIKTIGQLMLNSFRTIWTIIKNVVVGIVRGLVLLVKGLITGLKNAIVAIWNGIKTLSIAIWTGTKNAVLAIVRGWIALTRNNFAVLKAFLSALWNSIKNTAIKLWTALKIGVLAIIRTLVNTARNILNILKNFITRLWQSIKAISIKTWNAIKNGVINAIKGMYNGVRKILANLKTFITRTWTAIKNTTVKLVKGLSSGVKNVFNSLSKVTRSIFNKLKKFLSNVWRSIKNTTVKLAKALWSGVKNTFNSLYNGTKRIFNKLKNFMSNIWRNIKNTTVRLVKSLWSGVKNTWNSLSRGTRNIFNRVKSFMSNTWRSIKNTTVNMAKGLWNSVRRTFNNMNSGLKNIIGKIKGHITGMVNKVKSGLNKLIGGVNWVAGKIGMDKIPEIKFHTGTESTHTQNYVTNGKLNRNTLATVGDKGKGNGPGGFRHETIIPPKGKPFITPAKDTTMPLSKGTRILNGAQTHAMLSNGMTPMFNTGTIPRFASGTKKKLFQAVGETAGKFFNSAKKLKHNAMDSIGDKTKQAKEWGSEKLSQIKGAVGKGTKWLSDKVGDIADWVGKPGKLLNKVLGAFGVNMDAFGIAKSAEIPYNLMKAMFEKLKEAAKNLIDGWLEDEFSGGGGYNPYTKAPFHMTRGWTPSGHAGIDYGAPTGTPIPSPIDGKVIQSWFSPNQPSGGNETQIWDGQKYTHIFMHQSKRKVKVGDKVHQGQIIGKVGNTGNSFGSHLHWQVNKEKGYTDNHPQSIDPLKWAKEAAKAGGGVNKAASAWKPDIRRAAKAIGVRVSSADVNDVARLIQTESSGNAGVTQGIKDVNSGGNEAQGLLQYTPGSFNSYAIRGHKNIKNGYDQLLAFFNNTDWRANLSYWKRRMASGLTGWGPTGRRKKYATGGLIKNAGWYNIAEGGYPEWVIPTDPSRRNDAMKMLALAAQDIDKKSSTRGNKRPNNLKAPNNLYSNNNDELLLQMIEQQQQQINLLMEIARSNRGIENKEMEVNLDGKSLNKNNNKHQALNNATRLMGGR
Physico‐chemical
properties
protein length:2172 AA
molecular weight:238514,6 Da
isoelectric point:10,18
hydropathy:-0,29
Representative Protein Details
Accession
7quCP
Protein name
7quCP
Sequence length
841 AA
Molecular weight
91339,81810 Da
Isoelectric point
9,55855
Sequence
MAEQYEGVTIKLGLNTANIDRGMQALSRKMKTLNSEMKSHLSAFDMAEKSSDKYNGKIKILNKQLETQGQKVASAENKLKSLKDEQTKANEKIAESSQKLKAEKATLDTLNQTLSRHNSKLNQTKAAYDKADADLKRYKSDLDLLKAKHQEAGASVKTLKNKLTELTNSNKQNTAEFKRTQAQLNVVESEYKQLGAEVDKANLKYRSQRKTVEETKQAHQKMSQTVDKETQQLKVDIKEQEKVVNGAEQAHQKLQKRIGGLPASIDKAEKAVHQEKATFNSLQRQLKNTEAEYERYKQENSRTAQVTNRAKEAISALTTQLKRSLNQFKATGSSVSSYQTRINDLKNAHTQLKNNIAMLNHEHRRLSGEQGRNSEVARKLADKINVEKIKMNELSTQIKQTEGSLKEFEREQKIAASLSATPAGRAVQSINKYQDRLRDTANTMKSVGRTSMIYMTTPIVAGMGGAVKASIDWEDALTGVAKTTDMTGKELSNMGDKITDMSNKMPFAANEIAGVAEAAGQLGVKKSSILDFTKTMMDLSVATNMTADEAATQFAKFANAAGMPIDNVDRLGSAVVNLGNNTATTEKDIVNMGQRLAGAGAQAGFSADEIMSIAAAMSSVGIEAEAGGTAMTQIFNKMTKAAASGGDELKGFAKTSGMSAEQFAQTWENNPTKALSAFVKGLGNTKGGAKGVQKALEQVGISGIREADTVRRMANNHKVLDDALKVGSEGWKENNALTNEAQQRYDTLKSKLIVLKNNFVNFGKEIGATLEPILTPIINKLSDVFKGFQGASKGTKLFVVGLGGLAAVLPPIIFLAGSFAGALLNITKVLTGIPKMASVFS
Other Proteins in cluster: phalp2_38208
Total (incl. this protein): 6 Avg length: 1859,2 Avg pI: 10,04

Protein ID Length (AA) pI
7quCP 841 9,55855
A0A4P6R4F6 2031 10,06585
A0A499SIL1 2031 10,03974
Q4ZD65 2008 10,16952
A0AA49X3I8 2072 10,20427
Similar Clusters (pHMM search)
# Cluster # Members Identity (%) Alignment Length E-value
1 phalp2_38730
11Bbs
19 30,7% 533 4.007E-50

Domains

Domains [InterPro]

No domain annotations available.

Taxonomy

  Name Taxonomy ID Lineage
Phage uncultured Caudovirales phage
[NCBI]
2100421 No lineage information
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
CDS Source ID
CDS Source
MF417907 [NCBI]
CDS location
range 11295 -> 17813
strand -
CDS
GTGGCTGAATCAAGATTTAAAGGTTTATCAATCTTAATGAATATGCGTGATGTTGGTATTGAACGTACAATGAAACAAATACGAGCGCAATTCAAAACGTTAGATTCAGAAATGCGTAGATCTAATGCTAATTTCAAACACTCAGAGAAAAACATGCAGTCTTATGCAACAAGAACGAAAGAATTGACTAAAGCGATTGATGTAACTGAAAATTCTATGAAAGACATTTCTAATCAGTTAAAGAAAATGACTTTAGAAGAACAACGTTCTAGTGTTGAAGCCGAAAAGTTACGTCAAGAATACAGTAAGCAACATAGAGCATTACAAATGTATCAACGGCAATTGAATTCAACTGAACAAGAGATGAAACAATTCGGTACAACGACTAAACAAACAATTTTCTCAATGAAAAAGATTAATGATGTTCTAGGTACAATGAAACGTCAACTTAACATTGCAAATATGGCATTTCAAAGCACAGAAAAATCTACAAGTAGTTACAAGAATTATTTAAATCAATTAAACACAGTTATTCAAAAACATCAAAATACAATTAGAGTATTAGAAGGTCGTTATCAAAAGGTTGCTAGAGAACAAGGCGTTATGAGTAAAGAAGCGTTAGAGTTAAAAGAGAAAATCTTACAAGAAAAAGCAACTTTAGGACAACTAGACAATCAATATAAGAAAACGACTATGGAAGCCAAACGATTTGCATTTGAACAAAAAACATTAACTGCTTCAATGTCTGAAATTCGTCAAAAAATGTCACAAGTTGCACAATCTTTAACAATTAGTGCTAATAAATTCAAGATGAGTGGGCAAACTGCTCAAGCGTATAAAGCACGCATTTCTGAATTAAACAACGGAATGAAACAACAGCAACTTATTGTTCAAAATTTATCAAGACAGTATGACTTTGCTAAAAAACAATACGGTGCTACAAGCCAAGAAGCACAACAGCTTAATGTAAAATTATCTGAAGAACGTTTGAAATTAAAAGAGTTAAACACTCAATTAAATCAAACAACGCAAGCACATAATCGTTTAGAAATGGAACAAAAACAAGGCATTTCTTCTATGGCTCAAATTAGAGCGAAGATGTCGCAATTTAACGATACTCTATCACTATCAAGAAGTAATCTTGCTCGTGCAGGAGAAAGTGTAAAAGCCTATGGTAATCATTTAAACACACTTAAAACTAATATGTTAGAACAACGTGTAGTGTTAAAAGAGTTAATCGCACAATATAATCATGTGGCTACTGCACAAGGACGCAACAGTCAAGAAGCTAGAGAATTATCTAGTGCTATCACTCAACAAAAAATCAAGATGAATGAACTTGAGAGCGAACTAGATCAAACAACGCAAAGCTATAAACGACTAGAAACAGAACAACGGAACGCACAACGTTTAGCATCTAGTGGGTTTGGTAGAAGTATTCAAAGTGTCAATAAATATAAAGATTCAATTAGAAATGTAGGCTCTACTATGAGAAGTGTTGGATCTACTTCAATGCTTTATATGACTATGCCAGCAGTTGCAGGTATAGGAACAGCTATTAAATCTTCTGTTGATTGGGAACAAGCTTTAGCAGGTGTGGCTAAAACAACTAATATGAGTGGTAGCGAATTAAATAAAATGGGCAATGAGATTACTAAAATGAGTAATACAATGCCATTCGCTGCAACAGAAATAGCAGGAGTAGCAGAAGCTGCGGGACAATTAGGTATCAAGAAACAAGATATTTCTTCATTCACTAGAACAATGATGAACTTAGGTGTAGCTACAAATCTTACTGCAGATGAAGCAGCAACAGAGTTTGCAAGATTTGCTAATGCTGCAAATATGCCAATTAAAGATGTAGATAGATTAGGTTCGACAGTTGTTGCTTTAGGTAATAGTACAGCTACAACTGAAAAAGAAATTGTTGAAATGGCACAACGTTTAGCTGGTGCAGGCGCACAAGCTGGCTTTAGTTCTGATGAAATTATGTCAGTTAGTGCAGCGATGTCATCAGTAGGAATCGAGGCAGAAGCCGGCGGTACTGCCATGACACAAATTTGGAATAAGATGACAAAAGCTGTTGCTGAAGGTGGCGACACTTTAGATAGCTTTGCTAAAACTGCAGGAGTTAGTGGTAAAGAATTCGCACAAATTTGGGAGAACAACCCAAGTAAAGCATTATCAATGTTCGTTAAAGGTTTAGGTGAAACTGAAGGCGGAGCAAAAGGAGTATTAAAAGCCTTAGATGATGTAGGTATCAAAGGAATAAGAGAAGCCGATACTATTAGACGTATGGCTAACAATCATCAAGTTCTAGATAAAGCACTTAAAACAGGCTCAGAAGGTTGGAAAGAAAATAGTGCTTTAACTAATGAAGCTAACGTCCGTTACGAAACAATGGGTAGTAAGTTGAAAATGTTAAAAAACACTTTCATCAACTTTGCTAGAACAATTGGAGATGCAGTTGCACCTATCGTTTCATTCTTAGCAGATAAATTGACCGGACTATTCGAACACTTACAAGGGACAAGTAATGCTACTAAGATAGCAATCGCAGCATTTACTTTATTAGGTGTTGCTATACCTCCACTTATTGTTGCAACTGGTGTATTAGCACATAGTATCGTAGGTATCTCGGAAGCTATGACGTTACTTAATGCTACTAAAGGCGGCGCTAAGTTCTTTAGTCTATTTAATGGTGGTATTAAAGGAGTTTTACCTAATATTGCGCAACTATTAACTAAAATACCTTTAATTGGTGGACTAATGACTGCATTAACAGGTCCAGTTGGTATTGCAGTTGCAGCTATTGCAGGAATAGGAACAGCCTTTGTAGTAGCTTATAAAAAGTCAGAGACATTCAGAAATATTGTTAATGCGGTGATTAATCCGGTTAAAAATGCGTTTATCGGTTTATGGAATGTAATTAAACAATTTGGATCAGGTATAAAAGCAGTGTTTAGTAATGACACTGGTAAAGGGTTAAATATTTTTAAAAAGATTTTGCCTGATGAAGCAGCTAGACAATTTACATCTACCTTGTTAATGATACGTGGCGCTTACAATGATTTTGTTAACTTCATAAAAACAATATCGGTAGCCGTAGGTGCATTTTTCAAAGCATTTTGGAAAGAAAATGGCGCAAGTATTGTTAATGCATTTAAAGTTATAAAAGTAGGCGTAACTGCTACGTTGACAGTGCTGTACAATAATATCATTAAACCGATTTTAACAGGTATCAAGAATTTCTTTTCAATTATATTTGGTGGATTAAAACAAATTGTTATTAATACCTTCACTGGAATTCGTATGATTGTACAAGGCGGATTAAATGTAATACGTGGGATTATTAATATCTTTAAAGGTTTATTCACTGGCGATTTCTCATTAATGTGGCAAGGTATTAAACAAGTATTCAGTGGAGCTTTATCAGTTATTGCTGGTGTTTTAAGAGCTACCCTTGGCAACATGCTTATTATTATTAAAACAATAGGCCAATTAATGTTAAATTCATTCCGTACTATTTGGACGATTATTAAAAACGTTGTAGTAGGTATTGTCCGAGGCTTAGTTTTATTAGTCAAAGGTTTAATAACAGGATTGAAAAACGCGATAGTAGCAATATGGAATGGTATTAAAACTTTATCTATCGCAATTTGGACCGGAACTAAAAACGCTGTATTAGCAATTGTTCGTGGTTGGATAGCTTTAACTCGTAATAATTTTGCAGTTTTAAAAGCTTTCTTATCTGCATTATGGAATTCTATTAAAAATACTGCTATTAAATTATGGACTGCTTTAAAAATCGGAGTGCTAGCCATTATTCGAACGTTGGTCAACACAGCTAGAAATATCCTTAACATATTGAAAAACTTCATTACTCGTCTATGGCAAAGTATTAAAGCAATATCTATCAAAACTTGGAATGCTATTAAAAACGGTGTTATTAATGCTATTAAAGGTATGTATAACGGTGTCCGAAAAATACTAGCTAATTTAAAAACGTTTATCACAAGAACTTGGACAGCTATCAAAAACACAACAGTAAAACTCGTTAAAGGTTTGAGTAGCGGTGTTAAAAATGTATTTAATAGTTTATCTAAAGTAACACGTAGTATCTTTAATAAGTTAAAAAAATTCCTGTCTAATGTATGGCGTAGTATCAAAAACACTACAGTAAAATTAGCTAAAGCGTTATGGTCTGGTGTTAAAAATACATTTAACAGCTTATACAACGGTACTAAAAGAATTTTTAACAAACTTAAAAACTTTATGAGTAATATTTGGCGTAACATCAAGAATACAACAGTACGATTAGTGAAATCTTTATGGTCAGGTGTCAAAAATACTTGGAATAGTTTATCTCGTGGCACTCGTAACATTTTTAATCGAGTGAAAAGTTTCATGTCCAATACTTGGCGTAGTATCAAGAATACTACAGTTAATATGGCAAAAGGACTATGGAATAGTGTGCGAAGAACATTCAATAATATGAATAGTGGACTTAAAAATATTATTGGAAAAATCAAAGGTCATATTACTGGCATGGTTAATAAAGTTAAAAGTGGTTTGAATAAATTGATTGGTGGCGTGAACTGGGTAGCTGGCAAAATTGGAATGGATAAAATACCTGAAATAAAATTCCATACCGGTACTGAAAGCACCCACACACAAAATTATGTAACGAATGGTAAATTAAATCGTAATACACTTGCGACTGTAGGTGATAAAGGTAAAGGTAACGGTCCTGGTGGCTTTAGACATGAAACGATCATACCGCCTAAAGGTAAACCATTTATAACTCCAGCTAAAGATACGACTATGCCATTATCTAAAGGTACTCGTATTCTTAACGGCGCACAAACACATGCTATGTTAAGTAACGGTATGACACCTATGTTCAATACTGGAACTATACCTCGTTTCGCTAGTGGTACTAAGAAAAAATTATTCCAAGCAGTAGGAGAAACTGCAGGCAAGTTCTTTAATAGTGCAAAAAAACTAAAACACAATGCTATGGATAGTATTGGCGATAAAACTAAACAAGCTAAAGAATGGGGAAGCGAAAAGCTTTCTCAAATTAAAGGTGCAGTAGGAAAAGGCACTAAGTGGCTATCAGATAAGGTTGGAGATATAGCTGATTGGGTTGGTAAACCTGGCAAATTACTTAATAAAGTGCTTGGGGCGTTCGGAGTAAACATGGATGCATTCGGAATTGCTAAAAGCGCAGAAATACCATACAACTTAATGAAAGCTATGTTCGAAAAATTAAAAGAAGCAGCTAAAAACTTGATTGATGGTTGGTTAGAAGATGAATTTAGTGGCGGTGGAGGATATAATCCATACACTAAAGCACCATTCCATATGACAAGAGGATGGACACCGAGTGGACATGCTGGTATCGACTATGGTGCACCGACAGGAACGCCAATTCCATCTCCAATAGATGGTAAAGTTATTCAGTCTTGGTTTTCTCCTAACCAACCATCTGGTGGTAATGAGACACAGATTTGGGATGGACAAAAATACACACATATTTTCATGCACCAATCTAAACGTAAGGTAAAAGTCGGAGATAAAGTACATCAAGGACAAATTATAGGTAAAGTTGGTAATACTGGTAACTCATTTGGTTCTCACTTACATTGGCAAGTAAACAAAGAGAAAGGGTACACAGATAACCACCCTCAATCAATTGACCCGTTAAAATGGGCAAAAGAAGCAGCAAAAGCTGGTGGTGGCGTAAACAAAGCTGCAAGCGCTTGGAAACCAGATATCAGACGTGCTGCTAAAGCAATTGGTGTGCGAGTATCTAGCGCTGATGTGAATGATGTTGCTCGACTTATCCAAACAGAAAGTAGCGGTAATGCTGGAGTTACACAAGGGATAAAAGACGTGAACAGTGGAGGAAACGAAGCACAAGGCTTACTACAATACACACCAGGCTCATTTAATAGCTACGCAATCAGAGGGCATAAAAATATTAAAAACGGTTATGATCAATTACTTGCTTTCTTCAATAACACAGATTGGCGTGCTAACTTATCTTACTGGAAACGCCGAATGGCTAGTGGTTTAACTGGTTGGGGGCCAACTGGTAGACGTAAAAAGTACGCCACAGGTGGCTTAATCAAAAATGCAGGTTGGTACAACATTGCAGAAGGCGGTTATCCTGAATGGGTAATTCCGACTGATCCATCTAGACGCAATGACGCTATGAAGATGTTGGCACTTGCAGCACAAGATATAGATAAGAAAAGTAGTACTAGAGGAAATAAACGACCTAATAATTTAAAAGCACCAAATAACCTTTATTCAAATAATAATGATGAGTTATTACTACAAATGATTGAACAACAGCAACAACAAATTAATTTATTAATGGAAATTGCCAGAAGTAATAGAGGTATCGAGAATAAAGAAATGGAAGTCAATTTAGATGGTAAAAGTTTAAATAAAAACAATAATAAACATCAAGCATTAAATAATGCTACAAGATTAATGGGAGGTCGATAA

Gene Ontology

Description Category Evidence (source)
GO:0003824 catalytic activity molecular function None (UniProt)
GO:0016020 membrane cellular component None (UniProt)
GO:0031640 killing of cells of another organism biological process None (UniProt)
GO:0042742 defense response to bacterium biological process None (UniProt)
GO:0098003 viral tail assembly biological process None (UniProt)

Enzymatic activity

No enzymatic activity data available.

Tertiary structure

PDB ID
upi000ca0c655_model
Method AlphaFold3 (non-commercial)
Resolution -
Chain position -
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

The structures below correspond to the cluster representative (7quCP) rather than this protein.
PDB ID
7quCP
Method AlphaFoldv2
Resolution 76.22
Chain position -
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50