Zainteresowania naukowe

Interesuję się zastosowaniami matematyki związanymi ze statystyką i analizą danych. Więcej informacji można znaleźć poniżej oraz w moim CV oraz na moim koncie githubowym github
Piszę bloga dotyczącego analizy danych, eRa, statystyki, programowania i matematyki. To nie jest moje główne zajęcia, ale jeżeli ktokolwiek tę stronę czyta to nie wybaczłbym sobie zmarnowanej okazji na reklamę :) Życzę przyjemnej lektury!
Jestem zatrudniony na PWr w ramach europejskiego grantu IDEAL. Zajmuję się zagadnieniem identyfikacji ścieżek sygnałowych (gene pathways). Ta identyfikacja poprawia jakość modeli, przewidujących odpowiedź pacjentów na terapię. W dalszej perspektywie, celem jest wykorzystanie tej wiedzy w procesie planowania prób klinicznych. W szczególności rozwijam własną subspace clusteringu, dostępna jest w pakiecie eRowym na githubie, oraz metodę wyboru liczby składowych głównych w problemie PCA.

Jestem także autorem pakietu geneSLOPE w R slużącego do przeprowadzenia genome-wide association study za pomocą metody regularyzowanej regresji SLOPE.

Artykuły
  1. Bayesian dimensionality reduction with PCA using penalized semi-integrated likelihood, Piotr Sobczyk, Malgorzata Bogdan, Julie Josse, on arxiv.
  2. Controlling the rate of GWAS false discoveries, Damian Brzyski, Christine B. Peterson, Piotr Sobczyk, Emmanuel J. Candes, Malgorzata Bogdan, Chiara Sabatti, on bioarxiv, accepted to GENETICS.
Oprócz pracy na Politechnice współpracuję z Zakładem Genomiki UWr nad zagadnieniem bioinformatycznymi.
Artykuły
  1. Methods for comparing multiple digital PCR experiments, Michal Burdukiewicz, Stefan Rödiger, Piotr Sobczyk, Mario Menschikowski, Peter Schierack, Paweł Mackiewicz, Biomolecular Detection and Quantification, 2016;
  2. Prediction of amyloidogenicity based on the n-gram analysis Michal Burdukiewicz, Piotr Sobczyk, Stefan Rödiger, Anna Duda-Madej, Paweł Mackiewicz and Malgorzata Kotulska; accepted to German Conference on Bioinformatics 2016 Proceedings
Software
  1. Identyfikacja sekwencji sygnałowej w białku., Stworzony pakiet w języku R z implemenetacją metody opartej o ukryte łańcuchy Markowa dostępny jest na CRAN-ie .
  2. biogram: N-Gram Analysis of Biological Sequences, Pakiet na CRAN
Interesuję się modelami graficznymi. W szczególności problemem estymacji macierzy kowariancji w modelu gaussowskim, gdy liczba zmiennych jest znacznie większa niż licza obserwacji (p>>n). Rozwijana przeze mnie metoda jest oparta o techniki optymalizacji wypukłej.

Uczę się metod optymalizacji wypukłej. Jest to coraz bardziej popularna dziedzina, która pozwala na znalezienie dokładnego, nieopartego na heurystykach, rozwiązania wielu praktycznych problemów optymalizacji. Polecam wszystkim zainteresowanym świetną książkę Boyda

Rysunek pochodzi z książki ,,How to lie with statistics"