R Spatial

R Spatial

Giriş

 Burada, R ile konumsal analiz ve modelleme hakkında bilgi vermeye ve ilgili kaynakları paylaşmaya çalışacağız. Burada aslında R ile veri işlemenin temellerini ele alıyoruz.

R’de konumsal verilerle çalışmadan önce R dilinin bazı temellerini bilmek gerekebilir. Daha önce R ile çalışmadıysanız veya bilgilerinizi tazelemek için bu kısa girişe (Türkçesi ve R kodlama ile ilgili) bir göz atın. R veri bilimi için yaygın olarak kullanılan bir programlama dili ve yazılım ortamıdır. R ayrıca konumsal modelleme için konumsal verileri analiz etmek için benzersiz fırsatlar sunar.

R Spatial’ın “terra” versiyonu ve “raster” olmak üzere iki versiyonu bulunmaktadır. “terra” paketi, “raster” yerini alan yeni bir R paketidir. “terra”nın kullanımı daha kolaydır, daha fazla işlevselliğe sahiptir daha da hızlıdır. Bu nedenle, şüpheniz varsa terra sürümünü kullanın. (paketlerin kullanımı ile ilgili bilgi almak için tıklayın)

Belki önce Spatial verinin Jeo-uzamsal veri olarak da bilinen coğrafi konum verisi olduğunu söyleyerek başlamak lazım. Coğrafi konum verisi, dünya yüzeyindeki belirli bir konumu veya bu konum hakkındaki bilgiyi tanımlamak için kullanılan bir terimdir.

Birçokları için ‘coğrafi konum  verisi’ kelimesi doğrudan ‘harita’ anlamına gelebilir. Haritalar, kesinlikle coğrafi konum  verilerini görüntülemek için harika bir yol, ancak coğrafi konum verisi çok daha fazla veri içerebilir. Sonuçta, dikkat edecek olursak gördüğümüz ve yaptığımız her şeyin bir tür konumsal bileşeni var. 

Konumsal verileri ve belirli değişkenlerinin hayatımızı nasıl etkilediğini analiz ederek, belirli konumsal ilişkilerin neden var olduğu hakkında daha fazla bilgi edinebiliriz. Belirli yerler neden popüler seyahat noktalarıdır? Bir marka neden bir ülkede başarılı olurken diğerinde değil? İnsan davranışını ve bu gezegen üzerindeki etkimizi daha iyi anlamak için mekânsal ve konum verisi uygulamalarını benimsemeye başlamanın zamanı geldi.

Bir örnekle başlamak istersek dönüp 1854 de Londra’da Dr. John Snow’un kolera salgını ile ilgili yaptıklarını incelemek yeterli olur sanırım.  Tarihin o döneminde insanlar koleranın havadan yayıldığına inanıyorlardı. Ancak Dr. Snow bu hipoteze şüpheyle yaklaşıyordu.

Bu salgını daha iyi anlamak için bir şehir haritasında hastalıktan etkilenenlerin evlerini işaretledi . Böylece enfekte olanlar ile yaşadıkları yer arasında bir ilişki olduğunu fark etti. John Snow, bu basit konumsal analiz türünden, kolera salgınının asıl suçlusunu – kirlenmiş virüslü bir su kuyusunu – belirlemeyi başardı.

Bu analiz, bu kuyunun kapatılmasını sağlayarak birçok hayat kurtardı. Sadece ölüm oranı düşmekle kalmadı, aynı zamanda bu, koleranın aslında hava yoluyla bulaşmadığını ama kirlenmiş, virüslü yiyecek ve içeceklerin alınmasının bir sonucu olduğunu belirleyen bir kanıt da sağladı.

terra’nın en son yayınlanan sürümünü install.packages(“terra”) komutu ile CRAN’dan yükleyebilirsiniz. Geliştirme sürümü github’da mevcuttur ve kurulum için oradaki yönlendirmelere bakın. Raster ve sp paketleri ile aynı malzeme için tıklayın. Github sitesi, hata olduğuna inandığınız şeyleri (yazılımdaki hatalar) bildirmek veya yeni işlevler ve iyileştirmeler talep etmek için iyi bir yerdir. terra’nın nasıl kullanılacağına dair soruları gis.stackexchange veya stackoverflow üzerinden sorabilirsiniz.

Konumsal veriler çoğunlukla diğer veriler gibidir. Aynı genel ilkeler geçerlidir. Ancak, diğer veri türlerinde yaygın olmayan konumsal verileri kullanırken dikkate alınması oldukça önemli olan birkaç şey vardır. Bunlar ölçek ve bölgeleme, mesafe ve konumsal otokorelasyon konularını içermektedir.

Konumsal olaylar genellikle ya net sınırları olan ayrı nesneler olarak ya da her yerde gözlemlenebilen ancak doğal sınırları olmayan olaylar şeklinde sürekli olarak düşünülebilir. Ayrık mekansal nesneler bir nehir, yol, ülke, kasaba veya bir araştırma alanına atıfta bulunabilir. Sürekli olaylar veya “konumsal alanlar” örnekleri arasında yükseklik, sıcaklık ve hava kalitesi bulunur.

Konumsal nesneler genellikle vektör verileriyle temsil edilir. Bu tür veriler, nesnelerin “geometrisi” veya “şekli” tanımından oluşur ve normalde ek değişkenler de içerir. Örneğin, bir vektör veri seti, dünya ülkelerinin sınırlarını (geometri) tanımlayabilir ve ayrıca adlarını ve 2015’teki nüfuslarının büyüklüğünü; veya bir bölgedeki yolların geometrisini, türlerini ve adlarını saklayabilir. Bu ek değişkenlere genellikle “nitelikler” denir. Sürekli konumsal veriler (alanlar) genellikle bir raster veri yapısıyla temsil edilir. Bu arada “raster” görüntü tarama verisidir. Kağıt üzerine çizilmiş haritaların taranmasıyla elde edilen veri çeşididir.

R Spatial’da mekan veri iki türde olabiliyor vektör veri ve raster veri.

Vektör veri

Ana vektör veri türleri noktalar, çizgiler ve poligonlardır. Her durumda, bu veri yapılarının geometrisi, (x, y) koordinat çiftinden oluşur. Noktalar en basit durumdur. Her noktanın bir koordinat çifti ve n ilişkili değişkeni vardır. Örneğin, bir nokta, bir farenin kapana kısıldığı bir yeri temsil edebilir ve özellikleri; yakalandığı tarihi, onu yakalayan kişiyi, türün boyutunu ve cinsiyetini ve habitatla ilgili bilgileri içerebilir. Birkaç noktayı tek bir öznitelik kaydıyla çok noktalı bir yapıda birleştirmek de mümkündür. Örneğin, bir kasabadaki tüm kahve dükkanları veya eczaneler tek bir geometri olarak düşünülebilir.

Çizgilerin geometrisi ise biraz daha karmaşıktır. İlk olarak, ‘çizgi’ teriminin bir veya daha fazla çoklu çizgi kümesini (bağlı çizgi segmentleri serisini) ifade ettiğini unutmayın. Örneğin, mekânsal analizde, bir nehir ve tüm kolları tek bir ‘hat’ olarak kabul edilebilir (ancak aynı zamanda birkaç hat da olabilir, belki de her bir yan nehir için bir hat). Çizgiler, sıralı koordinat kümeleri (düğümler) olarak temsil edilir. Noktaları birleştirerek gerçek çizgi parçaları hesaplanabilir (ve bir harita üzerinde çizilebilir). Bu nedenle, bir çizginin temsili, çok noktalı bir yapınınkine çok benzer. Temel fark, noktaların sıralanmasının önemli olmasıdır, çünkü hangi noktaların bağlanması gerektiğini bilmemiz gerekir. Bir ağ (örneğin bir yol veya nehir ağı) veya konumsal grafik, akış, bağlantı, yön ve mesafe gibi şeyler hakkında ek bilgilerin bulunduğu özel bir çizgi geometrisi türüdür.

Bir poligon, bir dizi kapalı çoklu çizgiyi ifade eder. Geometri, çizgilerinkine çok benzer, ancak bir poligonu kapatmak için son koordinat çifti ilk çiftle çakışır. Poligonlarla ilgili bir komplikasyon, deliklere sahip olmalarıdır( bu, çevreleyen çokgenin parçalarını çıkarmaya yarayan, tamamen başka bir çokgen tarafından çevrelenmiş bir çokgendir.(örneğin, bir gölün içindeki bir adayı göstermek için. Ayrıca, geçerli çokgenler kendileriyle kesişmezler (ancak bir çizginin kendi kendini kesmesi uygundur). Yine, çoklu çokgenler tek bir geometri olarak kabul edilebilir. Örneğin Endonezya birçok adadan oluşur. Her ada tek bir çokgen ile temsil edilebilir, ancak daha sonra birlikte tüm ülkeyi temsil eden tek (çoklu) bir çokgen temsil edilebilir.

Vektör ———————- Raster

Raster veri

Raster veriler, yükseklik gibi konumsal olarak sürekli olayları temsil etmek için yaygın olarak kullanılır. Dünyayı bir ızgarada düzenlenmiş ayrı kare veya dikdörtgen hücrelere bölerek coğrafi özellikleri temsil eder. Her hücre, o konumun sıcaklık, yükseklik veya spektral değer gibi bazı özelliklerini temsil etmek için kullanılan bir değere sahiptir.

Bu hücrelerin her birine piksel (pixel) adı verilir. Piksel İngilizce sözcük anlamı olarak picture element (resim elemanı) teriminin kısaltmasıdır. Picture (resim) sözcüğü için pix kısaltması kullanılmıştır. Piksel sayısal ortamda bir
resmin bölünemeyen en küçük parçasıdır. Raster veri setlerinde öznitelik veri değerleri her bir piksele atanır. Bu değerler, deniz seviyesinden yükseklik, arazi kullanım değeri vb. gibi nümerik veya alfa-nümerik değerler olabilir. Raster veride konumsal verinin çözünürlüğü piksel boyutu ile belirlenir.

Raster verinin sol üst köşe koordinatı, piksel boyutu ve düzenli grid verinin boyutu (kaç piksele kaç piksel olduğu) bilindiğinde, satır ve kolonlardan oluşan matris yapısı içerisinde veri koordinatları kolaylıkla hesaplanabilmektedir. Grid yapısı bilgisayar yordamları ile iki boyutlu dizinler (array) olarak kodlandığı için, analitik ve cebirsel hesaplamalar hızlı ve kolay yapılabilmektedir.

Veri boyutunun büyüklüğü nedeni ile raster verilerde genellikle 1-bit ikili (binary) veri değeri kullanılır. Matematiksel olarak her piksel 0 veya 1 değerini alabilir. Veri boyutu büyütülerek piksel değeri 8-bit veri değerine çıkartılarak 256 farklı değer alabilir.

Kaynaklar:

Last updated by at .