SSIS İLE ETL NEDİR?
Veri ambarınızı on-prem bir SQL Server üzerinde tutup SSIS paketleriyle mi besleyeceksiniz, yoksa Azure Data Factory ile bulut tabanlı bir pipeline mı kuracaksınız? Bu karar yalnızca araç tercihi değildir; maliyet modelini, ekip becerilerini, gecikme süresini ve gelecekteki ölçek planınızı doğrudan belirler. SSIS, SQL Server kurulu her ortamda çalışan, paket tabanlı klasik bir ETL motorudur; rakipleri ise farklı felsefelerle aynı problemi çözmeye çalışır.
SSIS ile ETL'in Temel Mantığı
SSIS (SQL Server Integration Services), Microsoft SQL Server lisansıyla birlikte gelen bir veri entegrasyon platformudur. ETL kavramının üç adımı — Extract (çıkart), Transform (dönüştür), Load (yükle) — SSIS'te "Control Flow" ve "Data Flow" olmak üzere iki ayrı tasarım yüzeyinde modellenir. Bir SSIS paketi (.dtsx uzantılı XML dosyası), bir veya birden çok veri akışını, koşulları, döngüleri ve hata yönetimini birlikte barındırır. Pratik detaylar için konunun teknik kaynakları incelenebilir.
Tipik bir senaryoda kaynak, ERP sistemindeki bir SQL tablosu ya da CSV dosyası olur; hedef ise yıldız şemalı bir veri ambarı tablosudur. Aradaki dönüşüm adımları — kolon eşleme, veri tipi çevirimi, derived column, lookup, conditional split — Data Flow Task içinde görsel bileşenlerle kurulur. SSIS'in derinlemesine kullanımı için SSIS eğitimi içeriğinden yararlanabilirsiniz.
SSIS vs Azure Data Factory: On-Prem mi Bulut mu?
Azure Data Factory (ADF), Microsoft'un bulut tabanlı veri entegrasyon hizmetidir. SSIS ile karşılaştırıldığında temel ayrımlar netleşir:
- Konum: SSIS şirket içi sunucuda çalışır, ADF tamamen Azure üzerinde host edilir.
- Lisans modeli: SSIS, SQL Server lisansına dahildir; ADF pipeline çalıştırma, veri taşıma ve aktivite başına ücretlendirilir.
- Ölçek: ADF, talebe göre paralel olarak yüzlerce pipeline yürütebilir; SSIS sunucu donanımının sınırlarıyla bağlıdır.
- Bağlayıcı çeşitliliği: ADF, 90'dan fazla bağlayıcıyla SaaS uygulamalarına (Salesforce, ServiceNow, Google Analytics) hazır erişim sunar; SSIS'te bu tür kaynaklar için çoğunlukla üçüncü parti bileşen gerekir.
- Geliştirme deneyimi: SSIS, Visual Studio (SSDT) içinde sürükle-bırak çalışır; ADF, tarayıcıdaki Studio arayüzünde JSON tabanlı pipeline tasarımı yapar.
Yine de SSIS paketlerinizi ADF içinde "Integration Runtime" üzerinde lift-and-shift mantığıyla çalıştırmak mümkündür. Bu, mevcut yatırımı korurken buluta geçişi kademeli kılan bir köprü çözümüdür.

SSIS vs Talend: Açık Kaynak ve Java Tabanlı Yaklaşım
Talend, Java tabanlı kod üreten bir ETL platformudur. Tasarım yüzeyinde kurduğunuz iş akışı arka planda Java sınıflarına derlenir ve JAR olarak dağıtılır. Bu, SSIS'in XML tabanlı çalışma zamanından farklı bir mimari sunar.
- Platform bağımsızlığı: Talend Linux, Windows ya da konteyner üzerinde aynı paketle çalışır; SSIS Windows odaklıdır.
- Veritabanı yakınlığı: SSIS, SQL Server ile aynı süreçte çalıştığında yüksek throughput sunar; Talend, JDBC katmanı üzerinden çalıştığı için bazı senaryolarda ek katman gecikmesi yaşatabilir.
- Lisans: Talend Open Studio ücretsizdir, Talend Cloud ise abonelik modeliyle ücretlidir; SSIS, SQL Server Standard/Enterprise lisansıyla gelir.
- Big Data desteği: Talend, Spark ve Hadoop entegrasyonunda doğal olarak güçlüdür; SSIS bu alanda daha sınırlıdır.
SSIS vs Apache NiFi: Akış Bazlı Veri Hareketi
Apache NiFi, batch yerine "data in motion" felsefesini benimseyen, Apache Vakfı altında geliştirilen açık kaynak bir araçtır. SSIS gibi paket çalıştırmak yerine, sürekli akan FlowFile'ları işleyen processor'lardan oluşan canlı bir akış grafiği kurar.
- SSIS, batch ETL için optimize edilmiştir; NiFi ise streaming ve near-real-time senaryolar için tasarlanmıştır.
- NiFi'da her FlowFile'ın kökeni "data provenance" özelliğiyle uçtan uca izlenebilir; SSIS'te bu izleme manuel logging gerektirir.
- NiFi cluster mantığıyla yatay ölçeklenir; SSIS yatay ölçek için ayrı sunucularda paket paralelleştirme gerektirir.
- IoT, log toplama, sensör verisi gibi sürekli akışlarda NiFi tercih edilirken, gecelik ambar yüklemelerinde SSIS daha pratiktir.
Hangi Araç Hangi Senaryoda?
Tek bir "en iyi" ETL aracı yoktur; karar matrisi şu kriterlere göre kurulur:
- SSIS: Microsoft ekosisteminde, on-prem SQL Server'a sahip, batch ambar yüklemesi yapan ekipler için doğal seçim.
- Azure Data Factory: Bulut-öncelikli stratejisi olan, SaaS bağlayıcılarına ihtiyaç duyan ve ölçek esnekliği isteyen organizasyonlar için.
- Talend: Platform bağımsızlığı, Big Data entegrasyonu ve açık kaynak tercih eden ekipler için.
- Apache NiFi: Streaming, IoT, log toplama gibi sürekli akış senaryolarında ve veri köken izlemesi kritik olduğunda.
Maliyet ve Toplam Sahiplik Bakışı
Maliyet sadece lisans değildir. SSIS'te SQL Server lisansı zaten varsa ek ücret görünmez, ancak sunucu donanımı, yedekleme, güncelleme ve operasyon ekibi maliyeti TCO'ya eklenir. ADF tüketim bazlı olduğundan düşük yükte ucuz, yoğun pipeline'da hızla pahalı olabilir. Talend Open Studio sıfır lisanslıdır ama enterprise destek ve cluster yönetimi maliyetlidir. NiFi açık kaynaktır; ancak DevOps olgunluğu gerektirir.

SSIS Hâlâ Geçerli mi?
SSIS 2005'ten beri sahnededir ve hâlâ binlerce kurumda gecelik veri ambarı yüklemelerinin omurgasını oluşturur. ADF'in lift-and-shift desteğiyle birlikte SSIS paketleriniz emekli olmuyor; sadece çalıştığı yer değişiyor. SQL Server tarafında MERGE, CDC ve Change Tracking gibi yeteneklerin SSIS paketleriyle birleşimi, özellikle finansal raporlama ve regülatif veri ambarlarında hâlâ tartışmasız hızlı bir kombinasyondur. SSIS'i derinlemesine öğrenmek isteyenler SSIS eğitimi üzerinden konuya başlangıç yapabilir.
Sonuç olarak SSIS, ADF, Talend ve NiFi aynı problemi farklı felsefelerle çözer: SSIS olgun ve veritabanına yakın, ADF bulut-yerel ve elastik, Talend kod tabanlı ve platform bağımsız, NiFi ise akış odaklı ve izlenebilirdir. Doğru seçim; veri hacmi, gecikme toleransı, ekip becerisi ve mevcut altyapı yatırımının kesişiminde belirlenir.



