@MASTERSTHESIS\{IMM2003-02386, author = "M. Skettrup", title = "Multivariat dataanalyse af {2D-}elektroforesegeler", year = "2003", school = "Informatics and Mathematical Modelling, Technical University of Denmark, {DTU}", address = "Richard Petersens Plads, Building 321, {DK-}2800 Kgs. Lyngby", type = "", url = "http://www2.compute.dtu.dk/pubdb/pubs/2386-full.html", abstract = "Dette projekts form{\aa}l er at unders{\o}ge, om det med multivariat dataanalyse er muligt at finde enkelt-proteiner eller grupper af proteiner i hjernev{\ae}v, der adskiller epilepsiramte rotter fra en gruppe raske rotter. Proteinsammens{\ae}tningen i hjernev{\ae}v fra rotter er bestemt ved hj{\ae}lp af 2d-elektroforesegeler. Der blev analyseret pr{\o}ver fra 19 rotter, dels fra 12 rotter med tre forskellige grader af epilepsi (under udvikling, mild og sv{\ae}r) og dels fra en kontrolgruppe af 7 raske rotter. Datas{\ae}ttet best{\aa}r s{\aa}ledes af 19 observationer og 1849 variable (forskellige proteiner). Det er i dag standard at benytte univariate metoder til statistisk analyse af data fra 2d-elektroforesegeler, og som sammenligningsgrundlag for de, i dette projekt, benyttede multivariate analyser, er der udf{\o}rt en ikke-parametrisk ensidet variansanalyse og en t-test. Multivariate statistiske metoder tager, modsat de univariate metoder, h{\o}jde for korrelationer mellem variablene. Metoderne kan deles op i to hovedgrupper, ikke-superviserede og superviserede. De ikke-superviserede metoder omfatter principal komponentanalyse, faktoranalyse, clusteranalyse og kanonisk korrelationsanalyse, mens de superviserede metoder omfatter diskriminantanalyse, logistisk regression og klassifikationstr{\ae}er. Principal komponentanalyse og kanonisk korrelationsanalyse viste sig rimelig velegnede til at adskille de tre syge grupper af rotter fra hinanden og fra de raske. Med faktoranalyse og clusteranalyse er det muligt at inddele de 1849 variable i mindre grupper, hvor nogle af disse ser ud til at v{\ae}re interessante i forbindelse med epilepsi. Af de superviserede metoder var det kun diskriminantanalysen, der viste sig velegnet til data, og med denne blev fundet et par variable, som ser ud til at have en indflydelse p{\aa}, om rotten har epilepsi eller ej, og hvilken grad af epilepsi der kunne v{\ae}re tale om." }