Protein
- UniProt accession
- A0A6G5YKU6 [UniProt]
- Protein name
- NlpC/P60 domain-containing protein
- PhaLP type
-
endolysin
evidence: ML prediction
probability: 97 % (predicted by ML model)
- Protein sequence
-
MAESIRSQGWNLDFKVQGLDELKKTDERVDNIVSKLKEIQKLSAIHVSAPDLSQINKLDDRLNSIERKINTINNKMGNISPRINTNGIDNLTRSTNNAYRSTQNGIVANEKYRDSYKSMLPAVQTTSTGIKTSFEKVKDSTKGASQASEILNGKFRTISDTAINTNSKINTMNTRTGRTTSRFKDISNVGSDVINTFNNMTIALVPLGMALKNAFDQSTKLEDEYNRIKQLEIANEVSPNSAKRTINKMKKANRNLSLTYGLDQNDLARGSEELIRRGYSGKQDLGSHKYFAQSALATNESYNDIINADAPVLEQFGYKAKAGNSVKKMRKYTRNVLNKMAYIADITAGDNKEFGESFKMMGTTMHQNNQSLDTALGAVGTLSNFGVYGTMAGTSLKNIVSRLNKARNSKAITAGLADFGVSVPQLYDKHGDLKPLTSIFSMLRKGVKRNHMTSGQVSGDLQQIFGLWAFNSAQTLMAHGGDWQRNIRKSRAANGRDYIGKLAQRNLNTLQGQIKLTKAKLKDVGMQFAREIAPALTTVLKSINNILDWLGKLPKPVKRSLTYLTGVGSVIGGIKLGRGILGGFGRAFGMNAGAKSSGGILSKLFGYGTTREAVKKATGKVSTKIPNGLSDIFSGGSGDIGDLAATIPNDFRKGAGKIFKSPKKGWLARVSEANGGKLFTAGNVVSVGAGALQGGVEIAQGVDANNSRKYAQRNRSLGKGIGSLAGTGIGFGIGAMFGLGPVGAMIGSQIGDFVGGVGGDAVTGYNMKHAPKNKFSGQNMGWSFHNWQKQVGSWWNKKGGAADNIHAFTKTFGEDWRGTGRRIGSFGKWASDSWNGTKRNVGNFGKWVGNSWNGTKRNVGNFFGGIGRGIGNVGKGIGNGINYVLSGKIGSDAHDVWKKAITQSHYFFVSLPKNFDNLKKNVGKIWNDTWQNINNNRYVKAFKQGKLIQTGLSDIEKNTRGFRQRIGKIWNDTWKGINGNRYVKAIKKGKLIDTGLKDTEKNTRSFRQNFGKTWNGIWKSAGEHLGAFNKDVHKKWDKVWGVINDNRYVKAFKKGNLFGQIFEDVRSRFDAFKKSFQKVWGKFWNGLKDAVGGFGKWIKDSWGGTVNNIKGTINDINYAFGGNGKVFTWKKKGKKSTTKIPVQKAPKGRATVAAYATGGKISKTDFALVGEQGAELAYRNNGAFARLLGINGAAIEKVHAGEHILNARDTKKLLSGNSGLRLGAFAGGTTKLSNSYNKINRKNQNTWNAIASHTKNKVTQTKHTVLSTTNSMAKSLDKKMDNIHEGVVNTADKTAKGFGNKFKKLKGYASDAMEDTRKVLNNGIGGINKMLVQFGGNNSVIKPIKFAKGTNGKLANDTLAMVNDAPTGDKQEAIIHNNGFYLPQGENRIVHLSKGDQVLNNAQTNKIARMFGLTHFAKGSGVSDSTLRKIAKNSLNHPAASFNNMFTNNIKVSGTDLQQDIINSSKGAAKSLGYNWNKAMWTVIDEAMGGASGHGGTREAFLKYAEANFTGKPYQMGATGPNYYDCSGMVAKALAHYGINIGRDTVAMQHSNGVEYLGKKLSATRAGDLVIYGHGSGAAGHVGIIKNPNSGSMFNETPPSARVSAIADDMGMGYGFYRVRALRDATQKKAKKDNKLIALAKKELGSNALAWIKKHLSESLSGFKLGGDNASRINKLAKALRSADHKATKNGIAAVIGNWLFESGLDPSAVNSSGGASGLGQWLGGRLANLKAFAKKRNTSWTDPATQLLFALKHDGSDSATFRSILEGKGSVSSLANKFSSLWERGGYNQSHVNGALEAAKVLGYKNGGHPAPNTPVRINEEKGELAEFKSPVHIFSKEEAKRQLEFTASDRQRVRKNTSSRPVNITINVTGNTIDSKEREDSLSRKIKEAVRQALAEEMNTLGDEFGDDPSIF
- Physico‐chemical
properties -
protein length: 1914 AA molecular weight: 207600,00000 Da isoelectric point: 10,08481 aromaticity: 0,08150 hydropathy: -0,52424
Domains
Domains [InterPro]
Taxonomy
Name | Taxonomy ID | Lineage | |
---|---|---|---|
Phage |
Bacteriophage sp [NCBI] |
38018 | No lineage information |
Host | No host information |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
QHJ84847.1
[NCBI]
Genbank nucleotide accession
MN856069
[NCBI]
CDS location
range 33172 -> 38916
strand -
strand -
CDS
ATGGCAGAGAGTATTAGAAGTCAAGGTTGGAACCTAGACTTTAAAGTTCAAGGTTTAGATGAATTAAAAAAGACAGATGAAAGAGTCGATAATATTGTTTCTAAGCTTAAAGAAATTCAAAAACTCTCTGCTATTCATGTGTCTGCACCTGACTTAAGTCAGATCAACAAATTAGATGATAGGTTAAATTCAATTGAAAGAAAAATCAATACTATTAATAACAAAATGGGGAATATTTCACCCCGCATTAATACTAATGGTATTGATAATTTAACTCGTTCAACAAATAACGCTTACCGCTCAACACAAAATGGTATTGTAGCTAATGAAAAATATCGTGATAGTTATAAAAGTATGCTACCTGCTGTACAAACTACAAGCACTGGTATTAAAACTTCTTTTGAGAAAGTAAAAGACTCAACCAAAGGTGCTTCGCAAGCAAGTGAAATTCTTAATGGCAAGTTCAGAACCATAAGCGATACAGCGATAAACACTAATAGTAAAATTAATACAATGAATACGCGAACTGGTAGAACCACTTCGCGTTTTAAGGATATTTCAAATGTTGGTTCAGATGTTATCAATACATTTAACAACATGACAATTGCACTAGTTCCACTTGGTATGGCACTAAAAAATGCTTTTGATCAATCAACTAAGTTAGAAGATGAATACAACAGAATTAAGCAACTAGAGATTGCGAACGAAGTAAGTCCTAATTCTGCAAAACGTACGATAAATAAGATGAAAAAGGCTAACCGTAACCTTTCACTTACGTACGGACTTGATCAGAACGACCTTGCTCGTGGTTCTGAAGAATTAATCAGACGTGGATATTCCGGAAAACAAGACTTAGGATCACACAAATACTTTGCACAAAGTGCTTTAGCTACCAATGAAAGCTACAACGATATTATTAACGCAGACGCACCTGTATTGGAGCAATTCGGCTATAAAGCTAAAGCAGGCAACAGCGTTAAGAAAATGAGAAAATATACGCGCAATGTGCTAAATAAAATGGCTTACATTGCCGATATTACAGCCGGAGACAACAAAGAGTTTGGTGAAAGCTTCAAAATGATGGGAACCACCATGCACCAAAACAATCAATCTTTAGATACAGCTTTGGGTGCAGTCGGTACACTTTCTAACTTTGGTGTATACGGTACTATGGCAGGTACTAGTCTGAAAAACATTGTTTCTCGGCTTAATAAAGCTAGAAATAGTAAAGCAATTACTGCCGGACTTGCTGACTTCGGTGTAAGCGTTCCGCAATTATATGATAAACACGGAGACTTAAAACCATTAACAAGCATTTTTAGTATGCTTAGAAAAGGTGTCAAGCGTAATCACATGACTTCCGGACAAGTTTCCGGAGATTTACAGCAAATATTCGGCTTATGGGCGTTCAACTCGGCACAAACATTAATGGCACATGGCGGTGACTGGCAAAGAAATATTAGAAAGTCAAGAGCTGCTAATGGTAGAGACTATATTGGCAAACTGGCGCAAAGAAACTTAAATACTTTACAAGGTCAAATAAAGCTTACAAAAGCTAAATTAAAAGATGTAGGAATGCAATTCGCACGTGAAATTGCACCGGCACTTACAACAGTCCTTAAGTCAATTAATAATATTTTAGACTGGCTTGGTAAGCTGCCAAAACCGGTTAAAAGATCATTAACTTATTTAACTGGCGTTGGAAGTGTTATTGGCGGTATTAAATTAGGCCGTGGAATACTTGGCGGCTTTGGTAGAGCATTCGGTATGAATGCTGGTGCAAAATCAAGCGGTGGTATTTTAAGTAAATTATTTGGCTATGGAACTACCAGAGAAGCAGTCAAAAAAGCAACTGGTAAAGTATCAACAAAAATACCTAATGGTTTGTCAGATATATTTAGTGGTGGCAGTGGAGATATTGGTGATTTAGCTGCAACAATACCAAACGACTTCAGAAAAGGAGCCGGAAAAATATTCAAGAGTCCTAAAAAAGGCTGGCTTGCAAGAGTAAGTGAAGCCAACGGGGGCAAACTGTTTACTGCTGGCAATGTTGTTTCAGTTGGAGCCGGCGCGCTTCAAGGTGGCGTTGAAATTGCTCAAGGTGTTGACGCTAATAATTCACGTAAATATGCTCAACGAAATAGATCACTTGGTAAAGGTATAGGATCACTAGCCGGAACTGGTATAGGCTTTGGAATTGGCGCTATGTTTGGTCTCGGCCCGGTCGGAGCTATGATTGGTTCACAAATTGGTGACTTTGTTGGTGGTGTTGGCGGAGACGCAGTTACTGGCTACAACATGAAACACGCACCTAAAAACAAGTTTTCTGGTCAAAATATGGGGTGGTCATTCCATAATTGGCAAAAACAAGTTGGCAGTTGGTGGAATAAAAAAGGTGGAGCAGCTGACAACATTCATGCTTTCACCAAGACGTTTGGCGAAGACTGGCGTGGAACCGGTAGAAGAATTGGATCGTTTGGTAAGTGGGCAAGCGACAGTTGGAATGGAACCAAGCGTAACGTTGGCAATTTTGGTAAATGGGTAGGAAATAGTTGGAACGGAACCAAGCGTAATGTTGGTAATTTCTTTGGCGGAATTGGTCGTGGAATTGGCAATGTAGGCAAAGGTATTGGTAACGGTATTAACTATGTTCTTAGCGGGAAAATTGGTAGTGACGCTCATGACGTATGGAAGAAAGCTATTACCCAGTCTCACTACTTCTTTGTCAGTCTGCCAAAAAACTTTGACAATCTTAAAAAGAATGTTGGCAAAATTTGGAACGATACTTGGCAGAATATTAATAATAATCGTTATGTAAAAGCCTTTAAGCAAGGAAAATTAATTCAAACTGGCTTGTCCGATATTGAAAAAAATACTCGCGGCTTTAGACAGAGAATTGGCAAAATATGGAACGACACTTGGAAGGGTATTAATGGTAACCGCTATGTTAAGGCTATTAAAAAAGGCAAGCTAATTGATACTGGCTTAAAAGATACCGAAAAGAATACTCGTTCATTCAGACAAAACTTCGGCAAGACTTGGAATGGTATATGGAAAAGTGCCGGAGAACATCTTGGAGCTTTTAATAAAGATGTTCATAAAAAGTGGGACAAAGTATGGGGTGTCATTAATGATAACCGATATGTAAAAGCATTTAAAAAAGGAAACCTGTTTGGCCAAATTTTTGAAGATGTCAGAAGCCGTTTTGACGCATTTAAAAAGTCATTTCAAAAAGTATGGGGTAAATTCTGGAATGGACTTAAAGACGCAGTTGGCGGCTTTGGTAAATGGATCAAAGATAGTTGGGGCGGTACTGTTAATAATATTAAGGGTACTATCAATGATATTAACTATGCTTTTGGCGGTAATGGAAAAGTATTCACTTGGAAGAAAAAAGGCAAGAAGTCTACTACCAAGATACCAGTTCAGAAAGCGCCAAAAGGCAGAGCAACAGTGGCTGCTTATGCTACTGGCGGTAAAATTAGCAAAACTGATTTTGCTTTAGTTGGTGAACAAGGAGCTGAATTAGCTTACAGAAACAATGGTGCTTTTGCTAGACTGCTAGGAATAAATGGTGCTGCAATTGAAAAAGTACACGCCGGAGAACATATTCTCAATGCAAGAGATACTAAGAAATTATTAAGTGGCAATTCTGGACTTAGACTAGGTGCTTTTGCTGGCGGAACTACTAAACTAAGCAACAGTTATAACAAAATTAATAGGAAGAACCAAAATACTTGGAATGCAATTGCTAGTCATACTAAAAATAAAGTAACACAAACCAAGCATACTGTTTTGAGTACCACAAATAGTATGGCTAAGTCTCTTGACAAGAAAATGGATAATATCCATGAAGGCGTGGTAAATACCGCAGATAAAACAGCAAAAGGCTTCGGTAACAAGTTTAAAAAGCTTAAAGGATATGCTTCAGACGCTATGGAAGATACCCGTAAGGTACTTAACAACGGTATTGGCGGTATCAATAAAATGCTTGTGCAGTTTGGTGGCAATAATTCTGTTATCAAGCCAATCAAGTTTGCTAAAGGTACAAACGGCAAGCTTGCTAATGACACCTTAGCAATGGTCAATGACGCCCCCACTGGAGATAAACAAGAAGCTATTATTCATAACAATGGTTTCTACCTGCCACAAGGTGAAAACAGAATTGTTCATTTGAGTAAAGGTGATCAAGTCCTAAATAACGCACAAACAAATAAAATTGCTAGAATGTTTGGACTTACTCACTTCGCTAAAGGTTCCGGTGTTTCCGATAGCACTTTACGTAAAATTGCTAAAAATAGTCTTAATCACCCAGCTGCAAGTTTCAACAATATGTTTACAAACAACATTAAAGTTTCCGGTACAGACTTGCAACAAGATATTATTAACAGCAGTAAAGGTGCTGCAAAGAGTCTTGGCTACAATTGGAACAAGGCAATGTGGACTGTAATTGATGAAGCAATGGGTGGTGCTTCCGGACACGGTGGAACAAGAGAAGCATTCTTAAAATATGCTGAAGCAAACTTTACTGGTAAGCCTTATCAAATGGGAGCAACGGGGCCGAATTATTATGATTGTTCCGGCATGGTGGCTAAGGCTTTAGCACATTATGGCATTAACATTGGTCGTGACACCGTTGCTATGCAACACTCAAATGGTGTTGAATATTTAGGCAAAAAGCTAAGTGCAACAAGAGCAGGAGACTTAGTAATTTATGGTCATGGTTCGGGCGCTGCCGGACACGTTGGTATTATCAAGAACCCTAATTCTGGCAGTATGTTCAATGAAACACCCCCAAGTGCAAGAGTTTCTGCTATTGCAGATGATATGGGCATGGGGTATGGTTTCTACCGTGTAAGAGCATTAAGAGACGCTACCCAGAAAAAAGCCAAGAAAGACAATAAACTAATAGCACTTGCCAAAAAAGAACTTGGTTCAAACGCACTTGCATGGATAAAGAAACATTTAAGTGAAAGCTTAAGTGGCTTTAAACTTGGTGGAGACAATGCTTCAAGAATTAATAAACTTGCTAAAGCATTAAGAAGTGCCGATCATAAAGCCACAAAGAATGGTATTGCAGCAGTTATTGGTAACTGGCTATTTGAGTCTGGACTTGATCCAAGCGCAGTAAACAGTAGTGGCGGTGCTAGTGGTCTTGGTCAATGGCTAGGTGGAAGACTAGCGAACCTTAAAGCTTTTGCTAAAAAACGCAACACTTCATGGACTGACCCTGCAACGCAATTATTGTTTGCTTTAAAGCATGACGGTTCAGACAGTGCAACATTTAGATCAATTCTCGAAGGAAAAGGTAGTGTTTCTTCACTAGCTAACAAATTCTCTAGTCTTTGGGAGCGTGGCGGATATAACCAGTCACACGTAAATGGTGCTTTGGAAGCAGCTAAAGTATTGGGATATAAGAACGGGGGACACCCCGCACCTAATACACCAGTTAGAATTAACGAAGAAAAGGGAGAACTCGCAGAATTTAAGAGTCCGGTTCATATCTTTTCAAAAGAAGAAGCTAAAAGGCAACTAGAATTTACCGCTAGTGATAGACAGAGAGTACGTAAGAATACTTCTAGCCGTCCAGTAAACATAACTATTAATGTTACTGGCAATACAATTGATAGTAAGGAACGCGAAGATAGTCTTTCTAGGAAAATAAAAGAAGCTGTAAGACAAGCACTTGCGGAAGAAATGAATACTCTGGGAGATGAGTTTGGAGACGATCCAAGCATATTCTAA
Gene Ontology
Description | Category | Evidence (source) | |
---|---|---|---|
GO:0008234 | cysteine-type peptidase activity | Molecular function | Inferred from Electronic Annotation (UniProt) |
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
No tertiary structures available.