R İLE VERİ ANALİZİ EĞİTİMİ
R ile Veri Analizi eğitimi, dili "istatistikçi dili" klişesinden çıkartıp veri analizinin günlük aracı yapan bir programdır. tidyverse ekosistemiyle data wrangling; dplyr verb'leri (filter, mutate, summarise) ile pipeline kurulumu; ggplot2 ile grammar of graphics yaklaşımı somut veri senaryolarıyla işlenir.
Eğitim sonunda katılımcı, tidyr ile pivot_longer ve pivot_wider dönüşümleri yapar; lm, glm ve lme4 ile istatistiksel model kurar; R Markdown ile reproducible report yazar. Shiny ile interactive dashboard yayınlama eğitimin uygulamalı kapanışıdır. Eğitim, R Project belgeleri baz alınarak kurgulanır.
Katılımcı Profili
Bu eğitim, R'ı "istatistikçi dili" klişesinden çıkartıp veri analizinin günlük aracı yapmak isteyen rollere yöneliktir:
- İstatistikçiler: Akademik analizden endüstriye geçiş yapan roller
- Veri Bilimciler: tidyverse ile data wrangling yapan analistler
- Biyoistatistikçiler: Bioconductor ile genomik analiz yapan roller
- Finans Analistleri: Quantitative analiz ve risk modelleme yapanlar
- Veri Analistleri: SPSS veya Excel'den R'a geçiş yapan analistler
Ön Gereklilikler
Bu eğitime katılım için aşağıdaki ön bilgiler önerilir:
- İstatistik ve olasılık kavramlarına temel aşinalık
- Excel veya SPSS ile veriyle çalışma deneyimi
- Tablo, sütun ve veri tipi kavramlarına aşinalık
- Bir programlama veya scripting diline giriş düzeyi aşinalık (tercihen)
- RStudio'nun bilgisayara kurulu olması (eğitim öncesi)
Süresi ve Tarihi
Süre: 3 gün. Bu süre standart program içindir; ek modüllere ve hedefe göre süre özelleştirilebilir.
Eğitim tarihleri ve saatleri, ekibinizin uygunluğuna göre birlikte planlanır.
Kazanımlar
Eğitim sonunda katılımcı, R'ı "istatistikçi dili" klişesinden çıkartıp veri analizinin günlük aracı yapar:
- tidyverse ekosistemi ile data wrangling akışı kurar
- dplyr verb'leri (filter, mutate, summarise) ile pipeline yazar
- ggplot2 ile grammar of graphics yaklaşımıyla görsel üretir
- tidyr ile pivot_longer ve pivot_wider dönüşümleri yapar
- lm, glm ve lme4 ile istatistiksel model kurar
- R Markdown ile reproducible report yazar
- Shiny ile interactive dashboard yayınlar
R ile Veri Analizi Eğitimi Konuları
1. R Ekosistemi - RStudio ve Posit
- R CRAN ve Bioconductor
- RStudio IDE ve Posit Cloud
- R Project (.Rproj) ile workflow
- renv ile reproducible environment
2. Vektör, Liste, Faktör
- Atomic vector ve type coercion
- List ve nested structure
- Factor ve ordered factor
- NA, NULL, NaN, Inf farkı
3. Data Frame ve Tibble
- data.frame klasik yapı
- tibble ile modern alternatif
- str(), summary(), glimpse()
- Subset: $, [, [[, subset()
4. Veri Yükleme - readr, readxl, DBI
- readr ile hızlı CSV (read_csv)
- readxl ile Excel okuma
- DBI + odbc/RPostgres ile SQL
- jsonlite, xml2, googlesheets4
5. dplyr - Veri Manipülasyonu
- filter, select, mutate, arrange, summarise
- group_by ve summarise pipeline
- %>% ve |> pipe operatörü
- Window function: lag, lead, cumsum
6. tidyr - Tidy Data Prensibi
- pivot_longer, pivot_wider
- separate, unite ile kolon işlemleri
- nest, unnest ile list-column
- complete ve fill
7. stringr ve Regex
- str_detect, str_replace, str_extract
- Regex pattern temelleri
- str_split ve glue ile template
8. lubridate - Tarih ve Zaman
- ymd, mdy, dmy parser
- Date arithmetic ve interval
- floor_date, ceiling_date, round_date
- Timezone yönetimi
9. ggplot2 - Grammar of Graphics
- aes, geom, scale, theme katmanları
- geom_point, geom_line, geom_bar, geom_boxplot
- facet_wrap ve facet_grid
- theme_minimal, theme_bw ve custom theme
- patchwork ile çoklu grafik
10. İstatistiksel Test
- t.test, wilcox.test
- aov ve TukeyHSD (ANOVA)
- chisq.test, fisher.test
- cor.test (Pearson, Spearman)
- shapiro.test, ks.test
11. Lineer ve Lojistik Regresyon
- lm() ile linear model
- glm() ile generalized linear model
- Diagnostic plot (residuals, Q-Q)
- broom ile model output
12. Time Series - ts, forecast, fable
- ts object ve frekans
- forecast: ARIMA, ETS
- fable ile tidyverse uyumlu forecast
- Seasonal decomposition
13. Survival Analizi
- Survival object: Surv()
- Kaplan-Meier ile survfit
- Cox proportional hazards
- survminer ile görselleştirme
14. data.table - Yüksek Performans
- data.table söz dizimi: DT[i, j, by]
- Set operasyonları (referans ile)
- Büyük veri için bellek avantajı
- fread ile hızlı okuma
15. R Markdown ve Quarto
- Rmd ile reproducible rapor
- Quarto: Markdown çoklu çıktı (HTML, PDF, Word)
- Parameterized report
- Knit ve YAML header
16. Shiny Web Uygulaması
- UI ve server function
- Reactive expression
- shinydashboard ve bslib
- Shiny Server ve shinyapps.io deploy
17. Machine Learning - caret ve tidymodels
- caret ile geleneksel ML
- tidymodels: recipes, parsnip, workflows
- Cross-validation ve tuning
- yardstick ile metric
18. Profiling ve Performans
- profvis ile profiling
- Rcpp ile C++ entegrasyon
- parallel ve future ile parallel computing
- Memory yönetimi ve gc()
R İLE VERİ ANALİZİ EĞİTİMİ ile İlgili
Sıkça Sorulan Sorular ve Cevapları
tidyverse ile base R arasında karar nasıl verilir?
Base R kütüphane bağımlılığı olmadan çalışır, modeling fonksiyonları (lm, glm) base'de. tidyverse okunabilir, tutarlı API (dplyr, tidyr, ggplot2) — data manipulation ve görselleştirme için modern tercih. Modern R kodu çoğunlukla tidyverse + base modelling karması. data.table ayrı bir paradigma.
dplyr verb'leri (filter, mutate, summarise) pratikte nasıl zincirlenir?
%>% (magrittr pipe) veya |> (R 4.1+ native pipe) ile zincirleme — okunması soldan sağa. df %>% filter(x > 10) %>% mutate(y = x*2) %>% summarise(mean_y = mean(y)). Hata ayıklama için ara adımları head() ile kontrol. group_by + summarise yaygın aggregate pattern'i.
ggplot2 grammar of graphics yaklaşımı nasıl çalışır?
ggplot(data, aes(x, y)) + geom_point() + geom_smooth() + facet_wrap(~grup). Layer-based — data, aesthetic mapping, geom (görselleştirme türü), facet (alt grafikler), theme. Aynı kompozisyon ile yüzlerce farklı grafik üretilir. Patchwork ile çoklu grafik kompoze edilir.
tidyr pivot_longer ile pivot_wider ne zaman?
pivot_longer wide format'tan long'a — her ölçüm ayrı satır, ggplot ve istatistiksel modelleme için doğru. pivot_wider long'tan wide'a — özet tablo, rapor için. Veri analizinde long format default tercih edilir; sadece son sunumda wide'a çevrilir.
R Markdown ve Quarto arasında karar?
R Markdown olgun ekosistem, knitr engine, R ağırlıklı kullanım. Quarto yeni nesil, R + Python + Julia desteği, daha modern output (revealjs slide, websites). Yeni projeler Quarto'ya yöneliyor; mevcut R Markdown projeler kalabilir. Pandoc tabanlı output (HTML, PDF, Word, slide).
Shiny ile production'a dashboard nasıl taşınır?
Local geliştirme sonrası shinyapps.io (managed, ücretsiz tier), Shiny Server Open Source (kendi sunucusu) veya Posit Connect (enterprise) seçenekleri. Performance için reactive() ve isolate() doğru kullanım kritik. Async (promises, future) uzun-süren işlerde UI'ı dondurmaz. Authentication için Connect veya reverse proxy.



