PhaLP - Phage Lytic Protein database

UniProt accession

C0LZY8 [UniProt]

Protein name

Type measure protein

PhaLP type

VAL

evidence: GO annotation

probability: 99 % (predicted by ML model)

Protein sequence

MADKPIGNMKFGIGVEGVDNTIKTLDQLQSKMRQAESAMRANAKAFDDGGKSMQGLSQKTKDLNTVMGLEEQKIKILQKRRDEAIQKYGAESKQVDNLNTKINQSTAKYNAYNQQLSKTTTALEKQVVSSSKYGKQVEANNKATEKEVAIAKKHGTEIDVVKAKQEGQRRNLEIMNKAVREQSNEVTQLTKKYGANSTEVKEAQQKLQAYANEARKSEKNVDALGDELKETEKAMNGVSTESKEASSSASKLDGVFSSLKKTASGVGSSIKSGFGKIGSAIGSATKGVGIFLGAGALGAVANIGSKAFNTVKSSIDGALNRIDTLNNSTRAFENMGVATGDITKNMDKLQEATRGLPTALDSAVSNVQLLTASTDDMGLSVDVFKAMNDAILGFGGDAQMVDSAVVQLSQSFSNGKVDAQTWNSMINSGLGPTLNALAKEMGMTTGELKEGLSSGSISVRQFQDALVKMDKEGGGGLKSLEKIAKDSTQGFGTAIANMKSAVTRGTAKMIEGLNKSLEKMGLPSFQEQITNTGNRFEAFLGGLGNSLPELAKNLSWVGKVFKGTFDVFGKVTGEAWGYLSGFGKKVGMWAENIKRIWKGEGLINVGALGLDIKGINRIDSAVNKFKSSLSGLKSWGYNFKSAWEGNGLVDLDMLGLSDEKMKTVSNAIVGIKESLGRFKDYIKNAFTFGTGDGTPAGFFETLTKVVDFITVEIIPTVIPLIDKALKAITKLLGGAQKIFKIVLDFFVKELLPMIMPIIKELAEALGKIFDKISNWWDQNGDRIGKAIMNLLTLLKPIFAIAIEIVKSFVKSVVGFIDGMVDVITGIIDVFSMVLTGDFTGLWDAIKRIFFGGIQAVWEWFNLMFIGKIFKGVKGLGTSVKGTVKAMWDGVKNFFTSGGSSAGALFDKFGGSIKGIANNFKNAIKNTVSNMWNGIKNFFSSGANGAKNIFDGFKNGISGIANTMKNLVSNTIRNLWNGIKNTFSTGIKTVSGWFADLPNQMVRAVKNGAGAITNAFKGIFNGVLRAIGGPVNGIIGGANWVLEKFGAPQVAKWNVPQYEQGTGSGGHVGGPMVVNDGGGAEMVITPDGNAMIPKGRNVMMNAPKGTHVLNEHETSAFLGKRGRVPFYKKGTGFMDGVKDMWSNTKSFVGNGINKVKETISDVMDWVGKPLDLARNAIMGAMDLGGLSHIPLDMAKGLGSKATSAFAEKVKALFKKKEEEESAGAGGDWAPVIRKAAKYMGQSISSSQVAGLVAQIMRESGGNEKIVQSPDVVDINTLSGNPARGLLQYIPQTFDAYKVPGYGNINNGYHQLLAFFNNSNWENDLQYGKSGWGPRGHRIRGYFNGGIARTPQIATLAENGHPEVIIPTEPSKRGRALALLNQAKQMLGVKDERNHVGGSGESQDMALLVSLMQQQNELLQAILAKNTDVILDGKKMNKELNNLNRTQERNTRRNLGYI

Physico‐chemical properties

protein length:	1456 AA
molecular weight:	156400,00000 Da
isoelectric point:	9,52464
aromaticity:	0,07349
hydropathy:	-0,23606

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR013491	387	462	NCBIfam	Tape measure protein N-terminal
IPR023346	1226	1310	SUPFAM	Lysozyme-like domain superfamily
IPR013491	317	509	NCBIfam	Tape measure protein N-terminal

	Name	Taxonomy ID	Lineage
Phage	Enterococcus phage EFAP-1 [NCBI]	627087	No lineage information
Host	Enterococcus faecalis [NCBI]	1351	Bacteria > Firmicutes > Bacilli > Lactobacillales > Enterococcaceae > Enterococcus

Coding sequence (CDS)

Genbank protein accession

ACN86322.1 [NCBI]

Genbank nucleotide accession

FJ792813 [NCBI]

CDS location

range 6561 -> 10931
strand -

CDS

ATGGCAGATAAACCAATTGGGAATATGAAGTTTGGTATTGGTGTTGAGGGTGTAGACAATACCATTAAAACACTTGACCAGTTACAAAGTAAAATGCGACAAGCTGAAAGTGCTATGCGTGCAAATGCAAAGGCTTTTGATGACGGTGGTAAGAGTATGCAAGGTTTAAGTCAAAAAACAAAAGACTTAAACACAGTAATGGGGTTAGAAGAACAAAAGATTAAGATTTTGCAAAAGCGCAGAGATGAAGCCATTCAGAAATATGGTGCTGAATCTAAGCAAGTTGACAATCTTAACACTAAAATTAATCAATCAACAGCTAAGTATAATGCATACAACCAACAGTTATCAAAAACAACAACAGCACTAGAGAAACAAGTGGTTTCTTCAAGTAAATACGGTAAACAAGTTGAAGCTAATAACAAGGCAACAGAAAAAGAAGTTGCTATTGCCAAAAAACACGGTACAGAGATAGACGTTGTTAAGGCAAAACAAGAGGGTCAACGACGCAACCTAGAGATAATGAACAAGGCTGTCAGAGAACAGTCAAATGAGGTCACACAGTTAACTAAGAAGTATGGTGCTAACTCAACAGAGGTAAAAGAAGCACAGCAAAAACTACAAGCATACGCAAATGAAGCACGCAAAAGTGAAAAGAATGTGGATGCTTTAGGTGATGAACTAAAAGAAACAGAAAAAGCAATGAATGGTGTAAGTACAGAATCAAAAGAAGCTAGTTCAAGTGCTAGTAAGTTAGATGGTGTGTTTTCATCACTTAAAAAGACAGCTTCTGGTGTAGGTAGTTCTATCAAGTCAGGATTTGGCAAGATTGGTTCTGCTATTGGTTCAGCAACAAAGGGTGTAGGTATATTCTTAGGTGCTGGCGCATTAGGTGCAGTTGCAAACATTGGTTCAAAAGCGTTTAACACTGTTAAATCATCAATTGATGGTGCATTAAATAGGATTGATACATTAAACAATAGTACACGTGCCTTTGAGAACATGGGTGTAGCTACTGGGGATATAACCAAGAACATGGATAAGCTACAGGAAGCAACACGTGGGTTACCAACAGCCTTAGACAGTGCAGTGAGTAACGTTCAGTTGCTAACAGCATCAACAGATGATATGGGATTATCAGTTGACGTATTTAAAGCAATGAATGATGCTATCCTAGGTTTTGGTGGGGATGCACAGATGGTTGATAGTGCGGTTGTTCAGTTATCTCAATCATTCTCAAATGGTAAGGTAGATGCGCAAACGTGGAACTCAATGATTAACAGTGGTTTAGGACCTACCCTTAATGCCTTAGCAAAAGAAATGGGCATGACAACAGGTGAATTAAAAGAAGGATTGTCATCAGGTAGTATATCTGTAAGACAGTTCCAAGATGCCTTAGTTAAAATGGATAAAGAGGGTGGTGGCGGTCTTAAGTCATTAGAAAAGATAGCTAAAGATAGTACACAAGGTTTTGGTACTGCAATAGCCAACATGAAATCAGCTGTTACGCGTGGTACAGCCAAGATGATTGAAGGACTAAACAAATCACTAGAAAAAATGGGTCTACCATCTTTCCAAGAGCAGATAACAAACACAGGTAATAGGTTTGAAGCTTTCTTGGGTGGATTAGGTAACAGCCTACCTGAATTAGCCAAAAACCTTTCATGGGTTGGTAAGGTATTCAAGGGTACATTTGATGTATTTGGAAAAGTCACAGGTGAAGCGTGGGGTTACTTATCAGGCTTTGGTAAAAAAGTTGGTATGTGGGCAGAAAACATTAAACGTATTTGGAAAGGTGAGGGTCTCATAAATGTTGGCGCGCTTGGATTAGATATAAAGGGAATAAATAGAATTGACAGTGCAGTAAACAAGTTCAAATCATCATTAAGTGGGTTAAAATCATGGGGTTATAACTTTAAATCAGCATGGGAAGGTAATGGCTTAGTTGACTTAGACATGCTTGGTTTATCAGACGAAAAAATGAAAACTGTATCTAATGCTATTGTAGGTATTAAAGAATCATTAGGAAGATTTAAAGATTATATCAAAAATGCGTTCACTTTTGGTACTGGTGACGGTACACCAGCGGGATTCTTTGAAACATTAACAAAAGTAGTTGATTTTATCACAGTTGAGATTATTCCAACAGTTATACCATTAATTGACAAAGCCTTAAAAGCAATCACTAAGTTACTTGGTGGCGCTCAAAAGATTTTCAAAATAGTATTAGACTTCTTTGTAAAAGAACTACTACCAATGATTATGCCAATTATTAAAGAGTTAGCAGAAGCCTTAGGTAAGATATTTGACAAAATAAGCAATTGGTGGGACCAAAATGGTGACCGTATTGGTAAGGCAATTATGAACCTACTTACACTATTGAAACCAATCTTTGCTATTGCAATTGAAATTGTAAAATCATTTGTTAAATCAGTTGTGGGGTTCATTGATGGAATGGTTGATGTAATCACAGGTATTATTGATGTTTTTTCAATGGTATTAACAGGTGACTTCACTGGTTTGTGGGATGCGATTAAACGTATCTTCTTTGGTGGAATCCAAGCCGTTTGGGAATGGTTCAACCTAATGTTCATTGGTAAGATTTTCAAAGGTGTAAAAGGACTAGGTACATCAGTAAAAGGCACAGTGAAAGCCATGTGGGACGGAGTCAAGAACTTCTTTACAAGTGGCGGAAGTAGTGCGGGTGCGTTGTTTGATAAGTTTGGCGGAAGTATCAAAGGTATAGCTAATAATTTCAAGAATGCAATCAAGAACACAGTAAGTAACATGTGGAATGGTATCAAGAACTTCTTTAGTAGTGGGGCAAATGGTGCTAAAAATATCTTTGACGGATTTAAGAATGGTATAAGTGGTATTGCGAACACTATGAAAAACCTAGTAAGCAATACTATTCGTAATCTTTGGAACGGTATCAAGAACACATTTAGTACAGGAATTAAAACAGTTTCAGGCTGGTTTGCTGATTTACCAAACCAAATGGTGAGAGCAGTTAAGAACGGAGCTGGTGCAATAACTAATGCGTTTAAAGGTATTTTCAACGGAGTATTAAGAGCCATTGGTGGACCAGTAAATGGAATCATTGGCGGTGCTAACTGGGTACTAGAAAAATTTGGCGCACCACAAGTTGCCAAATGGAATGTACCACAGTATGAACAAGGAACAGGTTCAGGCGGACACGTTGGCGGACCTATGGTAGTAAATGATGGTGGCGGAGCTGAAATGGTAATCACACCTGATGGTAACGCAATGATACCTAAAGGGCGTAACGTAATGATGAACGCACCTAAAGGTACACATGTATTGAACGAACATGAAACATCAGCTTTCTTAGGTAAACGCGGGCGTGTGCCATTCTACAAAAAAGGAACTGGTTTCATGGATGGTGTAAAAGACATGTGGTCTAATACAAAATCATTTGTAGGTAACGGAATCAACAAGGTAAAAGAAACAATCAGTGATGTAATGGACTGGGTAGGTAAACCATTAGACCTAGCACGCAATGCAATTATGGGTGCAATGGACTTAGGTGGACTATCACACATCCCACTTGACATGGCAAAAGGATTAGGTAGTAAAGCCACATCTGCATTTGCTGAAAAGGTTAAAGCATTATTCAAGAAAAAAGAGGAAGAAGAATCAGCTGGTGCTGGTGGTGACTGGGCACCTGTTATCCGCAAGGCGGCGAAATACATGGGTCAATCAATCAGTAGTTCACAGGTAGCTGGTTTAGTTGCTCAAATCATGCGTGAATCAGGTGGTAATGAAAAGATTGTTCAAAGTCCAGATGTGGTTGACATTAACACATTGAGTGGTAACCCAGCACGAGGATTATTACAATATATTCCACAGACGTTTGATGCGTACAAAGTTCCAGGTTATGGTAACATTAACAATGGCTATCACCAATTATTAGCTTTCTTCAACAATAGTAATTGGGAAAATGACTTGCAGTACGGTAAATCAGGTTGGGGTCCACGTGGTCACCGTATTAGAGGTTACTTCAATGGTGGTATTGCAAGAACACCACAGATTGCAACACTGGCTGAAAACGGTCACCCTGAGGTTATCATACCAACTGAACCATCTAAACGAGGTAGAGCACTAGCGTTACTTAACCAAGCTAAACAGATGTTAGGTGTCAAAGACGAACGCAACCATGTAGGTGGCAGTGGCGAATCACAAGACATGGCATTATTGGTTAGCTTAATGCAACAACAGAACGAATTGTTACAAGCTATCTTAGCTAAAAACACAGATGTTATATTAGATGGTAAGAAGATGAACAAAGAGCTTAATAACCTCAACAGAACACAAGAACGAAACACTAGACGTAATCTAGGTTATATTTAA

	Description	Category	Evidence (source)
GO:0098003	viral tail assembly	Biological process	Inferred from Electronic Annotation (UniProt)

No enzymatic activity data available.

No tertiary structures available.

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Gene Ontology

Enzymatic activity

Tertiary structure