Interesuję się zastosowaniami matematyki związanymi ze statystyką i analizą
danych. Więcej informacji można znaleźć poniżej oraz w moim
CV oraz na moim koncie githubowym
Piszę bloga dotyczącego analizy danych, eRa, statystyki,
programowania i matematyki.
To nie jest moje główne zajęcia, ale jeżeli ktokolwiek tę stronę czyta to
nie wybaczłbym sobie zmarnowanej okazji na reklamę :)
Życzę przyjemnej lektury!
Jestem zatrudniony na PWr w ramach europejskiego grantu
IDEAL.
Zajmuję się zagadnieniem identyfikacji ścieżek sygnałowych
(gene pathways). Ta identyfikacja poprawia jakość modeli, przewidujących
odpowiedź pacjentów na terapię. W dalszej perspektywie, celem jest wykorzystanie tej
wiedzy w procesie planowania prób klinicznych.
W szczególności rozwijam własną subspace clusteringu, dostępna jest w pakiecie eRowym na
githubie, oraz metodę wyboru
liczby składowych głównych w problemie PCA.
Jestem także autorem pakietu geneSLOPE
w R slużącego do przeprowadzenia genome-wide association study
za pomocą metody regularyzowanej regresji SLOPE.
Artykuły
- Bayesian dimensionality reduction with PCA using penalized semi-integrated likelihood,
Piotr Sobczyk, Malgorzata Bogdan, Julie Josse,
on arxiv.
- Controlling the rate of GWAS false discoveries, Damian Brzyski, Christine B. Peterson, Piotr Sobczyk, Emmanuel J. Candes, Malgorzata Bogdan, Chiara Sabatti, on bioarxiv, accepted to GENETICS.
Oprócz pracy na Politechnice współpracuję z
Zakładem Genomiki UWr nad zagadnieniem bioinformatycznymi.
Artykuły
- Methods for comparing multiple digital PCR experiments, Michal Burdukiewicz, Stefan Rödiger, Piotr Sobczyk, Mario Menschikowski, Peter Schierack, Paweł Mackiewicz, Biomolecular Detection and Quantification, 2016;
- Prediction of amyloidogenicity based on the n-gram analysis Michal Burdukiewicz, Piotr Sobczyk, Stefan Rödiger, Anna Duda-Madej, Paweł Mackiewicz and Malgorzata Kotulska; accepted to German Conference on Bioinformatics 2016 Proceedings
Software
- Identyfikacja sekwencji sygnałowej w białku., Stworzony pakiet w języku R z implemenetacją metody opartej o ukryte łańcuchy Markowa dostępny jest na CRAN-ie .
- biogram: N-Gram Analysis of Biological Sequences, Pakiet na CRAN
Interesuję się modelami graficznymi. W szczególności problemem estymacji macierzy kowariancji w modelu gaussowskim, gdy liczba zmiennych jest znacznie
większa niż licza obserwacji (p>>n). Rozwijana przeze mnie metoda jest oparta o techniki optymalizacji wypukłej.
Uczę się metod optymalizacji wypukłej. Jest to coraz bardziej popularna dziedzina, która pozwala na znalezienie dokładnego,
nieopartego na heurystykach, rozwiązania wielu praktycznych problemów optymalizacji.
Polecam wszystkim zainteresowanym świetną książkę Boyda