wiki:ProteinComplexInventory

Version 16 (modified by vw253, 6 years ago) (diff)

--

From Oliver:0 (or a machine with MySql?) create_GO_complexes_list/

cat generate_complexes.sql | mysql -A --host=mysql-amigo.ebi.ac.uk -u go_select -P 4085 --password=amigo go_latest >GO_complexes (>17974 lines)

where

generate_complexes.sql is: SELECT t.acc, t.name, gene_product.symbol, gene_product.full_name, evidence.code, dbxref.xref_dbname FROM term AS cc INNER JOIN graph_path AS tcl ON cc.id = tcl.term1_id INNER JOIN graph_path AS acl ON tcl.term2_id = acl.term1_id INNER JOIN term AS t ON t.id=acl.term1_id INNER JOIN association ON association.term_id = acl.term2_id INNER JOIN gene_product ON association.gene_product_id = gene_product.id INNER JOIN species ON gene_product.species_id = species.id INNER JOIN evidence ON evidence.association_id = association.id INNER JOIN dbxref ON dbxref.id = gene_product.dbxref_id WHERE species.genus = 'Schizosaccharomyces' AND species.species = 'pombe' AND cc.name='macromolecular complex';

remove duplicate rows more GO_complexes_one | sort |uniq >GO_complexes_uniq

Remove complexes which are more specifically annotated or grouping terms

create_GO_complexes_list$ cat GO_complexes_uniq | grep -v GO:0005761 | grep -v GO:0031248 | grep -v GO:0031248 | grep -v GO:0034708 | grep -v GO:0043601 | grep -v GO:0055029 | grep -v GO:0005871 | grep -v GO:0005875 | grep -v GO:0008012 | grep -v GO:0017053 | grep -v GO:31248 | grep -v GO:0008012 | grep -v GO:0005874 | grep -v GO:0033202 | grep -v GO:0005667 | grep -v GO:0016585 | grep -v GO:0000123 | grep -v GO:0000118 | grep -v GO:0000152 | grep -v GO:0031461 | grep -v GO:0008287 | grep -v GO:0030530 | grep -v GO:0000445 | grep -v GO:0042788 |grep -v GO:0005844 | grep -v GO:0035770 |grep -v GO:0016471| grep -v GO:0000782| grep -v GO:0000777 | grep -v "GO:0043234" | grep -v GO:0032991 | grep -v "GO:0030529" | grep -v "GO:0000178" | grep -v "GO:0000313" | grep -v GO:0000151 | grep -v GO:0000314 | grep -v GO:0000315 | grep -v GO:0000776| grep -v GO:0005840 | grep -v GO:0015934 | grep -v GO:0015935 | grep -v GO:0016459 | grep -v GO:0016469 | grep -v GO:0030117 | grep -v GO:0030120| grep -v GO0030532 | grep -v GO:0030681 | grep -v GO:0031414 | grep -v GO:0032993 | grep -v GO:0033177 | grep -v GO:0033178 | grep -v GO:0034702 | grep -v GO:0043235 | grep -v GO:0044391 | grep -v GO:0045259 | grep -v GO:0045263 | grep -v GO:0045271 | grep -v GO:0045274| grep -v GO:0045282 | grep -v GO:0046930 | grep -v GO:0070461 |grep -v GO:1990351 | grep -v GO:1990391 | grep -v GO:1990234 | grep -v GO:1990204 | grep -v GO:1902911 |grep -v GO:1990104 | grep -v GO:0005677 | grep -v GO:1902494 | grep -v GO:0005732 | grep -v GO:0000796 | grep -v GO:0000796 | grep -v GO:0000796 | grep -v GO:0005721 | grep -v GO:0008278 | grep -v GO:0030532| grep -v GO:0070069 | grep -v GO:1902495 | grep -v GO:1902554 | grep -v GO:0044798 | grep -v GO:0031618 | grep -v GO:0000775 |grep -v GO:0000502 | grep -v GO:0000779 | grep -v GO:0000780 | grep -v GO:0000785 | grep -v GO:0000790 |grep -v GO:0000788 | grep -v GO:0000792 | grep -v GO:0000941 | grep -v GO:0000942 | grep -v GO:0005720 | grep -v GO:0005724 | grep -v GO:0022626 | grep -v GO:0030684 | grep -v GO:0030686 | grep -v GO:0030687 | grep -v GO:0030874 | grep -v GO:0031934 | grep -v GO:0036464 | grep -v GO:0044815 | grep -v GO:0045239 | grep -v GO:0070603 | grep -v GO:0070822 | grep -v GO:0090568| grep -v GO:1902493 | grep -v GO:1903293 | grep -v GO:0000778 | grep -v GO:0005681| grep -v GO:0005847 | grep -v GO:0030125 | grep -v GO:0030128 | grep -v GO:0030132| grep -v GO:0030894 | grep -v GO:003137| grep -v GO:0031379 | grep -v GO:0033553| grep -v GO:0090544 | grep -v GO:0000109| grep -v GO:0000428| grep -v GO:0030880 | grep -v GO:0031933 | grep -v GO:0000120 | grep -v GO:0090575| grep -v GO:1990342 |grep -v GO:1990342| grep -v GO:0030892 | grep -v GO:0030893 «grep -v cat GO_complexes_uniq | grep -v GO:0005761 | grep -v GO:0031248 | grep -v GO:0031248 | grep -v GO:0034708 | grep -v GO:0043601 | grep -v GO:0055029 | grep -v GO:0005871 | grep -v GO:0005875 | grep -v GO:0008012 | grep -v GO:0017053 | grep -v GO:31248 | grep -v GO:0008012 | grep -v GO:0005874 | grep -v GO:0033202 | grep -v GO:0005667 | grep -v GO:0016585 | grep -v GO:0000123 | grep -v GO:0000118 | grep -v GO:0000152 | grep -v GO:0031461 | grep -v GO:0008287 | grep -v GO:0030530 | grep -v GO:0000445 | grep -v GO:0042788 |grep -v GO:0005844 | grep -v GO:0035770 |grep -v GO:0016471| grep -v GO:0000782| grep -v GO:0000777 | grep -v "GO:0043234" | grep -v GO:0032991 | grep -v "GO:0030529" | grep -v "GO:0000178" | grep -v "GO:0000313" | grep -v GO:0000151 | grep -v GO:0000314 | grep -v GO:0000315 | grep -v GO:0000776| grep -v GO:0005840 | grep -v GO:0015934 | grep -v GO:0015935 | grep -v GO:0016459 | grep -v GO:0016469 | grep -v GO:0030117 | grep -v GO:0030120| grep -v GO0030532 | grep -v GO:0030681 | grep -v GO:0031414 | grep -v GO:0032993 | grep -v GO:0033177 | grep -v GO:0033178 | grep -v GO:0034702 | grep -v GO:0043235 | grep -v GO:0044391 | grep -v GO:0045259 | grep -v GO:0045263 | grep -v GO:0045271 | grep -v GO:0045274| grep -v GO:0045282 | grep -v GO:0046930 | grep -v GO:0070461 |grep -v GO:1990351 | grep -v GO:1990391 | grep -v GO:1990234 | grep -v GO:1990204 | grep -v GO:1902911 |grep -v GO:1990104 | grep -v GO:0005677 | grep -v GO:1902494 | grep -v GO:0005732 | grep -v GO:0000796 | grep -v GO:0000796 | grep -v GO:0000796 | grep -v GO:0005721 | grep -v GO:0008278 | grep -v GO:0030532| grep -v GO:0070069 | grep -v GO:1902495 | grep -v GO:1902554 | grep -v GO:0044798 | grep -v GO:0031618 | grep -v GO:0000775 |grep -v GO:0000502 | grep -v GO:0000779 | grep -v GO:0000780 | grep -v GO:0000785 | grep -v GO:0000790 |grep -v GO:0000788 | grep -v GO:0000792 | grep -v GO:0000941 | grep -v GO:0000942 | grep -v GO:0005720 | grep -v GO:0005724 | grep -v GO:0022626 | grep -v GO:0030684 | grep -v GO:0030686 | grep -v GO:0030687 | grep -v GO:0030874 | grep -v GO:0031934 | grep -v GO:0036464 | grep -v GO:0044815 | grep -v GO:0045239 | grep -v GO:0070603 | grep -v GO:0070822 | grep -v GO:0090568| grep -v GO:1902493 | grep -v GO:1903293 | grep -v GO:0000778 | grep -v GO:0005681| grep -v GO:0005847 | grep -v GO:0030125 | grep -v GO:0030128 | grep -v GO:0030132| grep -v GO:0030894 | grep -v GO:003137| grep -v GO:0031379 | grep -v GO:0033553| grep -v GO:0090544 | grep -v GO:0000109| grep -v GO:0000428| grep -v GO:0030880 | grep -v GO:0031933 | grep -v GO:0000120 | grep -v GO:0090575| grep -v GO:1990342 |grep -v GO:1990342| grep -v GO:0030892 | grep -v GO:0030893 | grep -v GO:0000808

next still need to check remove a few more after annotations fixes remove RNAs