Excel'de çoklu regresyon grafiği nasıl çizilir. Excel'de gerileme

Doğrusal bir regresyon oluşturmak, parametrelerini ve bunların önemini tahmin etmek, Excel analiz paketi (Regression) kullanıldığında çok daha hızlı yapılabilir. Elde edilen sonuçların yorumunu genel durumda ele alalım ( k açıklayıcı değişkenler) örnek 3.6'ya göre.

Masa regresyon istatistikleri değerler verilir:

çoklu R – çoklu korelasyon katsayısı;

R- kare- determinasyon katsayısı R 2 ;

normalleştirilmiş R - kare- ayarlandı R 2 serbestlik derecesi sayısına göre ayarlanmıştır;

standart hata regresyonun standart hatasıdır S;

gözlemler - gözlem sayısı N.

Masa varyans analizi verilen:

1. Sütun df - serbestlik derecesi sayısı, eşittir

dize için gerileme df = k;

dize için kalandf = N – k – 1;

dize için Toplamdf = N– 1.

2. Sütun SS- kare sapmaların toplamı, eşittir

dize için gerileme ;

dize için kalan ;

dize için Toplam .

3. Sütun HANIM formül tarafından belirlenen varyanslar HANIM = SS/df:

dize için gerileme– faktör varyansı;

dize için kalan kalan varyanstır.

4. Sütun F - hesaplanan değer F-formül ile hesaplanan kriterler

F = HANIM(gerileme)/ HANIM(kalan).

5. Sütun önemi F hesaplanan değere karşılık gelen anlamlılık düzeyi değeridir. F-İstatistik .

önemi F= İLK( F-İstatistik, df(gerileme), df(kalan)).

eğer önem F < стандартного уровня значимости, то R 2 istatistiksel olarak anlamlıdır.

	katsayılar	standart hata	t-istatistikleri	p değeri	alt %95	İlk %95
Y	65,92	11,74	5,61	0,00080	38,16	93,68
X	0,107	0,014	7,32	0,00016	0,0728	0,142

Bu tablo şunları gösterir:

1. Oranlar– katsayı değerleri A, B.

2. Standart hata regresyon katsayılarının standart hatalarıdır SA, Şb.

3. T-İstatistik– hesaplanan değerler T - şu formülle hesaplanan kriterler:

t-istatistik = Katsayılar / Standart hata.

4.R-değer (önem T) hesaplanan değere karşılık gelen anlamlılık düzeyi değeridir. T-İstatistik.

R-değer = STUDRASP(T-İstatistik, df(kalan)).

Eğer R-Anlam< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Alt %95 ve Üst %95 teorik doğrusal regresyon denkleminin katsayıları için %95 güven aralıklarının alt ve üst sınırlarıdır.

KALAN ÇEKİM
Gözlem	tahmin edilen y	e kalır
	72,70	-29,70
	82,91	-20,91
	94,53	-4,53
	105,72	5,27
	117,56	12,44
	129,70	19,29
	144,22	20,77
	166,49	24,50
	268,13	-27,13

Masa KALAN ÇEKİM belirtilen:

bir sütunda Gözlem– gözlem numarası;

bir sütunda tahmin edilen y bağımlı değişkenin hesaplanan değerleridir;

bir sütunda Kalıntılar e bağımlı değişkenin gözlenen ve hesaplanan değerleri arasındaki farktır.

Örnek 3.6. Gıda harcamalarına ilişkin mevcut veriler (arb. birimler) y ve kişi başına düşen gelir X dokuz aile grubu için:

X
y

Excel analiz paketinin (Regresyon) sonuçlarını kullanarak, gıda maliyetlerinin kişi başına gelir değerine bağımlılığını analiz ediyoruz.

Regresyon analizinin sonuçları genellikle şu şekilde yazılır:

burada parantez içinde regresyon katsayılarının standart hataları bulunmaktadır.

Regresyon katsayıları A = 65,92 ve B= 0.107. arasındaki iletişim yönü y Ve X regresyon katsayısının işaretini belirler B= 0.107, yani ilişki doğrudan ve pozitiftir. katsayı B= 0,107, kişi başına gelirde 1 arb artış olduğunu göstermektedir. birimler gıda maliyetleri 0,107 dönüşüm artar. birimler

Elde edilen modelin katsayılarının önemini tahmin edelim. Katsayıların önemi ( bir, b) karşı kontrol edilir T- Ölçek:

p değeri ( A) = 0,00080 < 0,01 < 0,05

p değeri ( B) = 0,00016 < 0,01 < 0,05,

dolayısıyla katsayılar ( bir, b) %1 düzeyinde, hatta %5 düzeyinde daha da anlamlıdır. Dolayısıyla, regresyon katsayıları anlamlıdır ve model orijinal verilere uygundur.

Regresyon tahmin sonuçları, sadece regresyon katsayılarının elde edilen değerleri ile değil, aynı zamanda setlerinin bir kısmı (güven aralığı) ile de uyumludur. %95 olasılıkla, katsayılar için güven aralıkları (38,16 - 93,68)'dir. A ve (0,0728 - 0,142) için B.

Modelin kalitesi belirleme katsayısı ile değerlendirilir R 2 .

Değer R 2 = 0,884, kişi başına gelir faktörünün gıda harcamalarındaki değişimin (dağılımın) %88,4'ünü açıklayabileceği anlamına gelir.

önemi R 2 tarafından kontrol edildi F- test: anlamlılık F = 0,00016 < 0,01 < 0,05, следовательно, R 2 %1 düzeyinde, hatta %5 düzeyinde daha da anlamlıdır.

İkili doğrusal regresyon durumunda, korelasyon katsayısı şu şekilde tanımlanabilir: . Korelasyon katsayısından elde edilen değer, gıda harcamaları ile kişi başına düşen gelir arasındaki ilişkinin çok yakın olduğunu göstermektedir.

28 Ekim

İyi günler, sevgili blog okuyucuları! Bugün doğrusal olmayan regresyonlardan bahsedeceğiz. Doğrusal regresyonların çözümü LINK'te görüntülenebilir.

Bu yöntem esas olarak ekonomik modelleme ve tahminde kullanılır. Amacı, iki gösterge arasındaki ilişkiyi gözlemlemek ve tanımlamaktır.

Doğrusal olmayan regresyonların ana türleri şunlardır:

polinom (ikinci dereceden, kübik);
hiperbolik;
güç;
gösteri;
logaritmik.

Çeşitli kombinasyonlar da kullanılabilir. Örneğin, bankacılık, sigortacılık, demografik çalışmalarda zaman serisi analitiği için bir tür logaritmik regresyon olan Gompzer eğrisi kullanılır.

Doğrusal olmayan regresyonların kullanıldığı tahminlerde esas olan, iki parametre arasında yakın bir ilişki olup olmadığını bize gösterecek olan korelasyon katsayısını bulmaktır. Kural olarak, korelasyon katsayısı 1'e yakınsa, o zaman bir bağlantı vardır ve tahmin oldukça doğru olacaktır. Doğrusal olmayan regresyonların bir diğer önemli unsuru, ortalama bağıl hatadır ( A ) aralığında ise<8…10%, значит модель достаточно точна.

Bunun üzerine belki teorik bloğu bitirip pratik hesaplamalara geçeceğiz.

15 yıllık bir araba satış tablomuz var (X olarak gösterelim), ölçüm adımlarının sayısı n argümanı olacak, bu dönemler için de gelirimiz var (Y olarak gösterelim), tahmin etmemiz gerekiyor gelirin gelecekte ne olacağı. Aşağıdaki tabloyu oluşturalım:

Çalışma için, denklemi (Y'nin X'e bağımlılığı) çözmemiz gerekiyor: y=ax 2 +bx+c+e. Bu bir çift ikinci dereceden regresyondur. Bu durumda, bilinmeyen bağımsız değişkenleri - a, b, c - bulmak için en küçük kareler yöntemini uyguluyoruz. Bu, formun bir cebirsel denklem sistemine yol açacaktır:

Bu sistemi çözmek için örneğin Cramer yöntemini kullanıyoruz. Sistemde yer alan toplamların bilinmeyenlerin katsayıları olduğunu görüyoruz. Bunları hesaplamak için tabloya (D, E, F, G, H) birkaç sütun ekleriz ve bunları hesaplamaların anlamına göre imzalarız - D sütununda x'in karesini alırız, E'de bir kübe, F'de - 4. kuvvet, G'de x ve y göstergelerini çarpıyoruz, H'de x'in karesini alıyoruz ve y ile çarpıyoruz.

Denklemi çözmek için gerekli olanlarla dolu bir form tablosu ortaya çıkacaktır.

Bir matris oluşturalım A denklemlerin sol tarafındaki bilinmeyenler için katsayılardan oluşan bir sistem. A22 hücresine koyalım ve " bir=". Regresyonu çözmek için seçtiğimiz denklem sistemini takip ediyoruz.

Yani, B21 hücresinde, X göstergesini dördüncü güce - F17 yükselttiğimiz sütunun toplamını yerleştirmeliyiz. Sadece - "=F17" hücresine bakalım. Sonra, X'in küp olduğu sütunun toplamına ihtiyacımız var - E17, sonra kesinlikle sisteme göre gidiyoruz. Bu nedenle, tüm matrisi doldurmamız gerekecek.

Cramer'in algoritmasına göre, A'ya benzer bir A1 matrisi toplayacağız, burada ilk sütunun elemanları yerine sistem denklemlerinin doğru kısımlarının elemanları yerleştirilmelidir. Yani, X sütununun karesi çarpı Y'nin toplamı, XY sütununun toplamı ve Y sütununun toplamı.

Ayrıca iki matrise daha ihtiyacımız olacak - bunlara A2 ve A3 diyelim, ikinci ve üçüncü sütunlar denklemlerin sağ taraflarının katsayılarından oluşacak. Resim böyle olacak.

Seçilen algoritmayı takiben, elde edilen matrislerin determinantlarının (determinantlar, D) değerlerini hesaplamamız gerekecek. MOPRED formülünü kullanalım. Sonuçlar J21:K24 hücrelerine yerleştirilecektir.

Cramer'e göre denklemin katsayılarını aşağıdaki formüle göre ilgili determinantların karşısındaki hücrelerde hesaplayacağız: A(M22 hücresinde) - "=K22/K21"; B(M23 hücresinde) — "=K23/K21"; İle(M24 hücresinde) - "=K24 / K21".

İstenen ikili ikinci dereceden regresyon denklemimizi elde ederiz:

y=-0,074x2 +2,151x+6,523

Doğrusal ilişkinin sıkılığını korelasyon indeksi ile tahmin edelim.

Hesaplamak için tabloya ek bir J sütunu ekleyin (buna y* diyelim). Hesaplama şu şekilde olacaktır (aldığımız regresyon denklemine göre) - "=$m$22*B2*B2+$M$23*B2+$M$24". J2 hücresine koyalım. Geriye kalan tek şey, otomatik doldurma işaretçisini J16 hücresine sürüklemektir.

Toplamları (Y-Y ortalaması) 2 hesaplamak için, karşılık gelen formüllerle tabloya K ve L sütunlarını ekleyin. ORTALAMA işlevini kullanarak Y sütunu için ortalamayı hesaplıyoruz.

K25 hücresine korelasyon indeksini hesaplamak için formülü yerleştiriyoruz - "=ROOT(1-(K17/L17))".

0,959 değerinin 1'e çok yakın olduğunu görüyoruz ki bu da satışlar ile yıllar arasında doğrusal olmayan yakın bir ilişki olduğu anlamına geliyor.

Geriye elde edilen ikinci dereceden regresyon denkleminin (belirleme indeksi) uyma kalitesinin değerlendirilmesi kalıyor. Korelasyon indeksinin karesinin formülü ile hesaplanır. Yani, K26 hücresindeki formül çok basit olacaktır - "=K25*K25".

0,920 katsayısı 1'e yakındır ve bu da yüksek kaliteli uyumu gösterir.

Son adım, bağıl hatayı hesaplamaktır. Bir sütun ekleyelim ve oraya şu formülü girelim: “=ABS((C2-J2)/C2), ABS — modül, mutlak değer. İşaretçiyi aşağı sürükleyelim ve M18 hücresinde ortalama değeri (ORTALAMA) görüntüleyeceğiz, hücrelere yüzde biçimini atayacağız. Elde edilen sonuç - %7,79 kabul edilebilir hata değerleri içindedir<8…10%. Значит вычисления достаточно точны.

Gerekirse, elde edilen değerlere göre bir grafik oluşturabiliriz.

Örnek bir dosya eklenmiştir - LINK!

Kategoriler:// 28 Ekim 2017 tarihli

Excel'de gerileme

İstatistiksel veri işleme, "Servis" menü alt öğesindeki eklenti Analiz paketi kullanılarak da gerçekleştirilebilir. Excel 2003'te açarsanız, HİZMET, sekmeyi bulamıyoruz VERİ ANALİZİ, ardından sekmeyi açmak için farenin sol düğmesine tıklayın EKLENTİLER ve zıt nokta ANALİZ PAKETİ farenin sol düğmesine tıklayarak bir onay işareti koyun (Şek. 17).

Pirinç. 17. Pencere EKLENTİLER

Bundan sonra menü HİZMET sekme görünür VERİ ANALİZİ.

Excel 2007'de yüklemek için PAKET ANALİZİ sayfanın sol üst köşesindeki OFİS düğmesine tıklamanız gerekir (Şek. 18a). Ardından, düğmeye tıklayın EXCEL SEÇENEKLERİ. Görünen pencerede EXCEL SEÇENEKLERİöğeye sol tıklayın EKLENTİLER ve açılır listenin sağ tarafında öğeyi seçin ANALİZ PAKETİ. Sonra, tıklayın TAMAM.

Excel Seçenekleri Ofis düğmesi

Pirinç. 18. Kurulum PAKET ANALİZİ Excel 2007'de

Analiz Paketini yüklemek için düğmesine tıklayın GİTMEK, açık pencerenin altında. Şekil l'de gösterilen pencere 12. yanındaki kutuyu işaretleyin ANALİZ PAKETİ. sekmesinde VERİ düğmesi görünecek VERİ ANALİZİ(Şek. 19).

Önerilen öğelerden öğeyi seçin " GERİLEME” ve farenin sol tuşu ile üzerine tıklayın. Ardından, Tamam'ı tıklayın.

Şekil l'de gösterilen pencere 21

Analiz Aracı « GERİLEME» en küçük kareler yöntemini kullanarak bir grafiği bir dizi gözleme sığdırmak için kullanılır. Regresyon, bir veya daha fazla bağımsız değişkenin değerlerinin tek bir bağımlı değişken üzerindeki etkisini analiz etmek için kullanılır. Örneğin, bir sporcunun atletik performansı yaş, boy ve kilo dahil olmak üzere çeşitli faktörlerden etkilenir. Bu üç faktörün her birinin bir sporcunun performansı üzerindeki etki derecesini hesaplamak ve daha sonra elde edilen verileri başka bir sporcunun performansını tahmin etmek için kullanmak mümkündür.

Regresyon aracı işlevi kullanır DOT.

REGRESS İletişim Kutusu

Etiketler Giriş aralığının ilk satırı veya ilk sütunu başlık içeriyorsa onay kutusunu seçin. Başlık yoksa bu onay kutusunu temizleyin. Bu durumda çıktı tablosu verileri için uygun başlıklar otomatik olarak oluşturulacaktır.

Güvenilirlik Düzeyi Çıktı toplamları tablosuna ek bir düzey eklemek için onay kutusunu seçin. Uygun alana, varsayılan %95 güven düzeyine ek olarak uygulamak istediğiniz güven düzeyini girin.

Sabit - sıfır Regresyon çizgisinin orijinden geçmesi için kutuyu işaretleyin.

Çıkış Aralığı Çıkış aralığının sol üst hücresine bir referans girin. Sonuçların çıktı tablosu için aşağıdakileri içerecek en az yedi sütun tahsis edin: varyans analizinin sonuçları, katsayılar, Y hesaplamasının standart hatası, standart sapmalar, gözlem sayısı, katsayılar için standart hatalar.

Yeni Çalışma Sayfası Çalışma kitabında yeni bir çalışma sayfası açmak ve analiz sonuçlarını A1 hücresinden başlayarak eklemek için bu kutuyu işaretleyin. Gerekirse, uygun radyo düğmesi konumunun karşısındaki alana yeni sayfa için bir ad girin.

Yeni Çalışma Kitabı Sonuçların yeni bir sayfaya ekleneceği yeni bir çalışma kitabı oluşturmak için bu kutuyu işaretleyin.

Artıklar Artıkları çıktı tablosuna dahil etmek için onay kutusunu seçin.

Standartlaştırılmış Artıklar Çıktı tablosuna standartlaştırılmış artıkları dahil etmek için onay kutusunu seçin.

Artık Grafik Her bir bağımsız değişken için artıkları çizmek için kutuyu işaretleyin.

Grafiği Sığdır Gözlenen değerlere karşı tahmin edilen değerleri çizmek için onay kutusunu seçin.

Normal Olasılık Grafiği Normal olasılığı çizmek için kutuyu işaretleyin.

İşlev DOT

Hesaplama yapmak için ortalama değeri göstermek istediğimiz hücreyi imleç ile seçin ve klavyeden = tuşuna basın. Ardından, Ad alanında istediğiniz işlevi belirtin, örneğin ORTALAMA(Şek. 22).

Pirinç. 22 Excel 2003'te İşlev Bulma

eğer sahada İSİM fonksiyonun adı görünmez, ardından alanın yanındaki üçgene sol tıklayın, ardından fonksiyonların listesini içeren bir pencere görünecektir. Bu işlev listede yoksa, listedeki öğeye sol tıklayın DİĞER FONKSİYONLAR, Bir iletişim kutusu belirecektir. FONKSİYON MASTER, dikey kaydırmayı kullanarak istediğiniz işlevi seçin, imleçle seçin ve üzerine tıklayın TAMAM(Şek. 23).

Pirinç. 23. İşlev Sihirbazı

Excel 2007'de fonksiyon aramak için menüde herhangi bir sekme açılabilir, ardından hesaplama yapmak için imleç ile ortalama değeri görüntülemek istediğimiz hücreyi seçin ve klavyede = tuşuna basın. Ardından, Ad alanında işlevi belirtin ORTALAMA. İşlevi hesaplama penceresi Excel 2003'tekine benzer.

Ayrıca Formüller sekmesini seçebilir ve " İŞLEV EKLE» (Şek. 24), bir pencere görünecektir FONKSİYON MASTER, görünümü Excel 2003'e benzer. Ayrıca menüde, içinde arama yapacağımız işlev kategorisini (son kullanılan, finansal, mantıksal, metin, tarih ve saat, matematiksel, diğer işlevler) hemen seçebilirsiniz. İstenen işlev için.

Diğer özellikler Referanslar ve diziler

Matematiksel

Pirinç. 24 Excel 2007'de işlev seçimi

İşlev DOT mevcut verilere en iyi yaklaşan düz bir çizgiyi hesaplamak için en küçük kareler yöntemini kullanarak bir serinin istatistiklerini hesaplar ve ardından elde edilen düz çizgiyi tanımlayan bir dizi döndürür. Ayrıca işlevi birleştirebilirsiniz DOT polinom, logaritmik, üstel ve kuvvet serileri dahil olmak üzere bilinmeyen parametrelerde (bilinmeyen parametreleri doğrusal olan) doğrusal olan diğer model türlerini hesaplamak için diğer işlevlerle birlikte. Bir dizi değer döndürüldüğünden, işlev bir dizi formülü olarak belirtilmelidir.

Düz bir çizginin denklemi:

(birden fazla x değeri aralığı olması durumunda),

burada bağımlı değer y bağımsız değer x'in bir fonksiyonudur, m değerleri her x bağımsız değişkenine karşılık gelen katsayılardır ve b bir sabittir. y, x ve m'nin vektör olabileceğine dikkat edin. İşlev DOT bir dizi döndürür . DOT ek regresyon istatistikleri de döndürebilir.

DOT(bilinen_y-değerleri; bilinen_x-değerleri; sabit; istatistikler)

Bilinen_y değerleri - ilişki için zaten bilinen y değerleri kümesi.

Bilinen_y dizisinin bir sütunu varsa, bilinen_x dizisinin her sütunu ayrı bir değişken olarak yorumlanır.

Bilinen_y dizisinin bir satırı varsa, bilinen_x dizisinin her satırı ayrı bir değişken olarak yorumlanır.

Bilinen_x'ler, ilişki için halihazırda bilinen isteğe bağlı bir x'ler kümesidir.

Bilinen_x dizisi, bir veya daha fazla değişken kümesi içerebilir. Yalnızca bir değişken kullanılırsa, aynı boyuta sahip oldukları sürece diziler_bilinen_y_değerler ve bilinen_x_değerler herhangi bir şekilde olabilir. Birden fazla değişken kullanılıyorsa, bilinen_y'ler bir vektör olmalıdır (yani, bir satır yüksekliğinde veya bir sütun genişliğinde).

Dizi_bilinen_x atlanırsa, bu dizinin (1;2;3;...) dizi_bilinen_y ile aynı boyutta olduğu varsayılır.

Sabit, b sabitinin 0 olması gerekip gerekmediğini belirten bir boole değeridir.

"const" bağımsız değişkeni DOĞRU ise veya atlanmışsa, b sabiti normal olarak değerlendirilir.

"const" argümanı YANLIŞ ise, b'nin değerinin 0 olduğu varsayılır ve m'nin değerleri, ilişki sağlanacak şekilde seçilir.

İstatistikler, ek regresyon istatistiklerinin döndürülüp döndürülmeyeceğini gösteren bir Boolean değeridir.

İstatistikler DOĞRU ise DOT, ek regresyon istatistikleri döndürür. Dönen dizi şöyle görünecektir: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

İstatistik YANLIŞ ise veya atlanmışsa, DOT yalnızca m katsayılarını ve b sabitini döndürür.

Ek regresyon istatistikleri.

Değer Tanım se1,se2,...,sen m1,m2,...,mn katsayıları için standart hata değerleri. seb b sabiti için standart hata ('sabit' YANLIŞ ise seb = #YOK). r2 Belirleme faktörü. y'nin gerçek değerleri, düz çizgi denkleminden elde edilen değerlerle karşılaştırılır; karşılaştırma sonuçlarına göre, determinizm katsayısı hesaplanır, 0'dan 1'e normalleştirilir. 1'e eşitse, o zaman modelle tam bir korelasyon vardır, yani gerçek ve tahmin edilen değerler arasında fark yoktur y. Aksi takdirde, determinizm katsayısı 0 ise, y değerlerini tahmin etmek için regresyon denklemini kullanmanın bir anlamı yoktur. r2'nin nasıl hesaplanacağı hakkında daha fazla bilgi için, bu bölümün sonundaki "Açıklamalar" bölümüne bakın. sey y tahmini için standart hata. F F-istatistik veya F-gözlemlenen değer. F istatistiği, bağımlı ve bağımsız değişkenler arasında gözlenen bir ilişkinin rastgele olup olmadığını belirlemek için kullanılır. df Özgürlük derecesi. Serbestlik dereceleri, istatistiksel bir tabloda F-kritik değerleri bulmak için kullanışlıdır. Modelin güven düzeyini belirlemek için tablodaki değerleri LINEST tarafından döndürülen F istatistiği ile karşılaştırmalısınız. df'nin hesaplanması hakkında daha fazla bilgi için bu bölümün sonundaki "Açıklamalar" bölümüne bakın. Aşağıdaki Örnek 4, F ve df'nin kullanımını göstermektedir. ssreg Regresyon kareler toplamı. ssresid Artık kareler toplamı. ssreg ve ssresid'in hesaplanması hakkında daha fazla bilgi için, bu bölümün sonundaki "Açıklamalar" bölümüne bakın.

Aşağıdaki şekil, ek regresyon istatistiklerinin döndürülme sırasını göstermektedir.

notlar:

Herhangi bir düz çizgi, eğimi ve y ekseni ile kesişimi ile tanımlanabilir:

Eğim (m): Genellikle m ile gösterilen bir doğrunun eğimini belirlemek için doğru üzerinde iki nokta almanız gerekir ve ; eğim olacak .

Y kesişimi (b): Bir doğrunun y kesişimi, genellikle b ile gösterilir, doğrunun y eksenini kestiği noktanın y değeridir.

Düz çizgi denklemi şu şekildedir. m ve b'nin değerleri biliniyorsa, doğru üzerindeki herhangi bir nokta, denklemde y veya x değerleri yerine yazılarak hesaplanabilir. TREND işlevini de kullanabilirsiniz.

Yalnızca bir bağımsız değişken x varsa, aşağıdaki formülleri kullanarak doğrudan eğimi ve y-kesişimini elde edebilirsiniz:

Eğim: DİZİN(DOT(bilinen_y'ler, bilinen_x'ler), 1)

Y-kesme noktası: DİZİN(DOT(bilinen_y'ler, bilinen_x'ler), 2)

DOT işlevi tarafından hesaplanan düz çizgi kullanılarak yapılan yaklaşımın doğruluğu, veri dağılımının derecesine bağlıdır. Veriler düz bir çizgiye ne kadar yakınsa, DOT tarafından kullanılan model o kadar doğru olur. DOT işlevi, verilere en uygun olanı belirlemek için en küçük kareler yöntemini kullanır. Yalnızca bir bağımsız değişken olduğunda x, m ve b aşağıdaki formüller kullanılarak hesaplanır:

burada x ve y örnek araçlardır, örneğin x = ORTALAMA(bilinen_x'ler) ve y = ORTALAMA(bilinen_y'ler).

DOT ve LGRFPRIBL sığdırma işlevleri, verilere en iyi uyan düz veya üstel bir eğri hesaplayabilir. Ancak sorunun çözümü için iki sonuçtan hangisinin daha uygun olduğu sorusuna cevap vermiyorlar. Düz bir çizgi için TREND(bilinen_y-değerleri; bilinen_x-değerleri) işlevini veya bir üstel eğri için BÜYÜME(bilinen_y-değerleri; bilinen_x-değerleri) işlevini de hesaplayabilirsiniz. Bu işlevler, new_x_values argümanından atlanırsa, düz bir çizgiye veya eğriye göre gerçek x değerleri için hesaplanan y değerleri dizisi döndürür. Daha sonra hesaplanan değerleri gerçek değerlerle karşılaştırabilirsiniz. Görsel karşılaştırma için grafikler de oluşturabilirsiniz.

Bir regresyon analizi gerçekleştirirken Microsoft Excel, her nokta için tahmin edilen y değeri ile gerçek y değeri arasındaki farkın karesini hesaplar. Bu kare farkların toplamına artık kareler toplamı (ssresid) denir. Microsoft Excel daha sonra toplam kareler toplamını (sstotal) hesaplar. const = DOĞRU ise veya bu argüman belirtilmemişse, toplam kareler toplamı, gerçek y değerleri ile ortalama y değerlerinin kareleri alınmış farklarının toplamına eşit olacaktır. sabit = YANLIŞ ise, kareler toplamı gerçek y değerlerinin karelerinin toplamına eşit olacaktır (ortalama y'yi y bölümünden çıkarmadan). Bundan sonra karelerin regresyon toplamı şu şekilde hesaplanabilir: ssreg = sstotal - ssresid. Artık kareler toplamı ne kadar küçükse, determinizm katsayısı r2'nin değeri o kadar büyük olur; bu, regresyon analizi kullanılarak elde edilen denklemin değişkenler arasındaki ilişkileri ne kadar iyi açıkladığını gösterir. r2 katsayısı ssreg/sstotal'a eşittir.

Bazı durumlarda, bir veya daha fazla X sütunu (Y ve X değerlerinin sütunlarda olduğu varsayılarak) diğer X sütunlarında ek bir öngörü değerine sahip değildir, başka bir deyişle, bir veya daha fazla X sütununun silinmesi, Y değerlerinin ortaya çıkmasına neden olabilir. aynı hassasiyetle hesaplanır. Bu durumda, gereksiz X sütunları regresyon modelinden çıkarılacaktır. Bu fenomene "eşdoğrusallık" denir, çünkü X'in gereksiz sütunları birkaç yedeksiz sütunun toplamı olarak temsil edilebilir. DOT, eşdoğrusallığı kontrol eder ve herhangi bir gereksiz X sütunu bulursa, regresyon modelinden kaldırır. Kaldırılan X sütunlar, DOT çıktısında 0 faktörü ve se değeri 0 ile tanımlanabilir. Bir veya daha fazla sütunun fazlalık olarak kaldırılması, df'nin değerini değiştirir çünkü bu, gerçekte tahmin amaçlı kullanılan X sütun sayısına bağlıdır. Df'nin hesaplanmasıyla ilgili daha fazla ayrıntı için aşağıdaki Örnek 4'e bakın.Gereksiz sütunların kaldırılması nedeniyle df değiştiğinde, sey ve F değerleri de değişir. Doğrusallığın kullanılması genellikle önerilmez. Ancak deney konusunun ayrı bir grupta olup olmadığının göstergesi olarak bazı X sütunlarında 0 veya 1 bulunuyorsa kullanılmalıdır. const = TRUE ise veya bu bağımsız değişken belirtilmemişse DOT, kesişme noktasını simüle etmek için ek bir X sütunu ekler. Erkekler için 1, kadınlar için 0 değerlerine sahip bir sütun varsa ve kadınlar için 1 ve erkekler için 0 değerlerine sahip bir sütun varsa, son sütun kaldırılır çünkü değerleri şu adresten alınabilir: "erkek göstergesi" sütunu.

Eşdoğrusallık nedeniyle X sütunun modelden çıkarılmadığı durumlar için df'nin hesaplanması şu şekildedir: k bilinen_x sütun varsa ve const = DOĞRU veya belirtilmemişse df = n - k - 1. const = YANLIŞ ise, o zaman df = n -k. Her iki durumda da, eşdoğrusallık nedeniyle X sütunlarının kaldırılması, df'nin değerini 1 artırır.

Dizi döndüren formüller, dizi formülleri olarak girilmelidir.

Örneğin, bir bilinen_x_değerler argümanı olarak bir sabit dizisi girerken, aynı satırdaki değerleri ayırmak için noktalı virgül, satırları ayırmak için iki nokta üst üste kullanın. Ayırıcı karakterler, kontrol panelindeki "Dil ve Standartlar" penceresindeki ayarlara bağlı olarak değişebilir.

Regresyon denkleminin öngördüğü y değerlerinin, denklemi tanımlamak için kullanılan y değerleri aralığının dışında olmaları durumunda doğru olmayabileceğini unutmayın.

Fonksiyonda kullanılan ana algoritma DOT, fonksiyonların ana algoritmasından farklıdır EĞİM Ve ÇİZGİ SEGMENTİ. Algoritmalar arasındaki farklılıklar, belirsiz ve eşdoğrusal veriler için farklı sonuçlara yol açabilir. Örneğin, bilinen_y bağımsız değişkeninin veri noktaları 0 ise ve bilinen_x bağımsız değişkeninin veri noktaları 1 ise, o zaman:

İşlev DOT 0'a eşit bir değer döndürür. İşlev algoritması DOT eşdoğrusal veriler için uygun değerleri döndürmek için kullanılır, bu durumda en az bir cevap bulunabilir.

EĞİM ve KESME İŞLEVLERİ #SAYI/0! hatası verir. SLOPE ve INTERCEPT fonksiyonlarının algoritması sadece bir cevap bulmak için kullanılır ve bu durumda birkaç cevap olabilir.

Diğer regresyon türleri için istatistiklerin hesaplanmasına ek olarak, DOT, x ve y değişkenlerinin fonksiyonlarını DOT için bir dizi x ve y değişkeni olarak girerek diğer regresyon türlerinin aralıklarını hesaplamak için kullanılabilir. Örneğin, aşağıdaki formül:

DOT(y-değerleri, x-değerleri^SÜTUN($A:$C))

aşağıdaki formun bir küp yaklaşımını (3. derece polinom) hesaplamak için bir Y değerleri sütunu ve bir X değerleri sütunu ile çalışır:

Formül, diğer regresyon türlerinin hesaplamaları için değiştirilebilir, ancak bazı durumlarda çıktı değerlerinde ve diğer istatistiklerde ayarlamalar yapılması gerekir.

İstatistiksel veri işleme, eklenti kullanılarak da gerçekleştirilebilir. ANALİZ PAKETİ(Şek. 62).

Önerilen öğelerden öğeyi seçin " GERİLEME” ve farenin sol tuşu ile üzerine tıklayın. Ardından, Tamam'ı tıklayın.

Şekil l'de gösterilen pencere 63.

Regresyon aracı işlevi kullanır DOT.

REGRESS İletişim Kutusu

Sabit - sıfır Regresyon çizgisinin orijinden geçmesi için kutuyu işaretleyin.

Yeni Çalışma Kitabı Sonuçların yeni bir sayfaya ekleneceği yeni bir çalışma kitabı oluşturmak için bu kutuyu işaretleyin.

Artıklar Artıkları çıktı tablosuna dahil etmek için onay kutusunu seçin.

Standartlaştırılmış Artıklar Çıktı tablosuna standartlaştırılmış artıkları dahil etmek için onay kutusunu seçin.

Artık Grafik Her bir bağımsız değişken için artıkları çizmek için kutuyu işaretleyin.

Grafiği Sığdır Gözlenen değerlere karşı tahmin edilen değerleri çizmek için onay kutusunu seçin.

Normal Olasılık Grafiği Normal olasılığı çizmek için kutuyu işaretleyin.

İşlev DOT

Düz bir çizginin denklemi:

y=m 1 x 1 +m 2 x 2 +…+b (birkaç x değeri aralığı olması durumunda),

burada bağımlı değer y bağımsız değer x'in bir fonksiyonudur, m değerleri her x bağımsız değişkenine karşılık gelen katsayılardır ve b bir sabittir. y, x ve m'nin vektör olabileceğine dikkat edin. İşlev DOT bir dizi döndürür(mn;mn-1;…;m 1 ;b). DOT ek regresyon istatistikleri de döndürebilir.

DOT(bilinen_y-değerleri; bilinen_x-değerleri; sabit; istatistikler)

Bilinen_y değerleri - y=mx+b ilişkisi için zaten bilinen y değerleri kümesi.

Bilinen_y dizisinin bir sütunu varsa, bilinen_x dizisinin her sütunu ayrı bir değişken olarak yorumlanır.

Bilinen_y dizisinin bir satırı varsa, bilinen_x dizisinin her satırı ayrı bir değişken olarak yorumlanır.

Bilinen_x değerleri - y=mx+b ilişkisi için zaten bilinen isteğe bağlı bir x değerleri kümesi.

Dizi_bilinen_x atlanırsa, bu dizinin (1;2;3;...) dizi_bilinen_y ile aynı boyutta olduğu varsayılır.

Sabit, b sabitinin 0 olması gerekip gerekmediğini belirten bir boole değeridir.

"const" bağımsız değişkeni DOĞRU ise veya atlanmışsa, b sabiti normal olarak değerlendirilir.

"const" argümanı YANLIŞ ise, b'nin değerinin 0 olduğu varsayılır ve m'nin değerleri, y=mx ilişkisini sağlayacak şekilde seçilir.

İstatistikler, ek regresyon istatistiklerinin döndürülüp döndürülmeyeceğini gösteren bir Boolean değeridir.

İstatistikler DOĞRU ise DOT, ek regresyon istatistikleri döndürür. Dönen dizi şöyle görünecektir: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

İstatistik YANLIŞ ise veya atlanmışsa, DOT yalnızca m katsayılarını ve b sabitini döndürür.

Ek regresyon istatistikleri (Tablo 17)

Değer	Tanım
se1,se2,...,sen	m1,m2,...,mn katsayıları için standart hata değerleri.
seb	b sabiti için standart hata ('sabit' YANLIŞ ise seb = #YOK).
r2	Belirleme faktörü. y'nin gerçek değerleri, düz çizgi denkleminden elde edilen değerlerle karşılaştırılır; karşılaştırma sonuçlarına göre, determinizm katsayısı hesaplanır, 0'dan 1'e normalleştirilir. 1'e eşitse, o zaman modelle tam bir korelasyon vardır, yani gerçek ve tahmin edilen değerler arasında fark yoktur y. Aksi takdirde, determinizm katsayısı 0 ise, y değerlerini tahmin etmek için regresyon denklemini kullanmanın bir anlamı yoktur. r2'nin nasıl hesaplanacağı hakkında daha fazla bilgi için, bu bölümün sonundaki "Açıklamalar" bölümüne bakın.
sey	y tahmini için standart hata.
F	F-istatistik veya F-gözlemlenen değer. F istatistiği, bağımlı ve bağımsız değişkenler arasında gözlenen bir ilişkinin rastgele olup olmadığını belirlemek için kullanılır.
df	Özgürlük derecesi. Serbestlik dereceleri, istatistiksel bir tabloda F-kritik değerleri bulmak için kullanışlıdır. Modelin güven düzeyini belirlemek için tablodaki değerleri LINEST tarafından döndürülen F istatistiği ile karşılaştırmalısınız. df'nin hesaplanması hakkında daha fazla bilgi için bu bölümün sonundaki "Açıklamalar" bölümüne bakın. Aşağıdaki Örnek 4, F ve df'nin kullanımını göstermektedir.
ssreg	Regresyon kareler toplamı.
ssresid	Artık kareler toplamı. ssreg ve ssresid'in hesaplanması hakkında daha fazla bilgi için, bu bölümün sonundaki "Açıklamalar" bölümüne bakın.

Aşağıdaki şekil, ek regresyon istatistiklerinin döndürülme sırasını göstermektedir (Şekil 64).

notlar:

Herhangi bir düz çizgi, eğimi ve y ekseni ile kesişimi ile tanımlanabilir:

Eğim (m): genellikle m ile gösterilen bir doğrunun eğimini belirlemek için, doğru üzerinde (x 1 ,y 1) ve (x 2 ,y 2) iki nokta almanız gerekir; eğim (y 2 -y 1) / (x 2 -x 1)'e eşit olacaktır.

Y kesişimi (b): Bir doğrunun y kesişimi, genellikle b ile gösterilir, doğrunun y eksenini kestiği noktanın y değeridir.

Düz çizgi denklemi y=mx+b şeklindedir. m ve b'nin değerleri biliniyorsa, doğru üzerindeki herhangi bir nokta, denklemde y veya x değerleri yerine yazılarak hesaplanabilir. TREND işlevini de kullanabilirsiniz.

Yalnızca bir bağımsız değişken x varsa, aşağıdaki formülleri kullanarak doğrudan eğimi ve y-kesişimini elde edebilirsiniz:

Eğim: DİZİN(DOT(bilinen_y'ler, bilinen_x'ler), 1)

Y-kesme noktası: DİZİN(DOT(bilinen_y'ler, bilinen_x'ler), 2)

burada x ve y örnek araçlardır, örneğin x = ORTALAMA(bilinen_x'ler) ve y = ORTALAMA(bilinen_y'ler).

Dizi döndüren formüller, dizi formülleri olarak girilmelidir.

Regresyon denkleminin öngördüğü y değerlerinin, denklemi tanımlamak için kullanılan y değerleri aralığının dışında olmaları durumunda doğru olmayabileceğini unutmayın.

İşlev DOT 0'a eşit bir değer döndürür. İşlev algoritması DOT eşdoğrusal veriler için uygun değerleri döndürmek için kullanılır, bu durumda en az bir cevap bulunabilir.

EĞİM ve KESME İŞLEVLERİ #SAYI/0! hatası verir. SLOPE ve INTERCEPT fonksiyonlarının algoritması sadece bir cevap bulmak için kullanılır ve bu durumda birkaç cevap olabilir.

DOT(y-değerleri, x-değerleri^SÜTUN($A:$C))

aşağıdaki formun bir küp yaklaşımını (3. derece polinom) hesaplamak için bir Y değerleri sütunu ve bir X değerleri sütunu ile çalışır:

y=m 1 x+m 2 x 2 +m 3 x 3 +b

Formül, diğer regresyon türlerinin hesaplamaları için değiştirilebilir, ancak bazı durumlarda çıktı değerlerinde ve diğer istatistiklerde ayarlamalar yapılması gerekir.

Bazı değerlerin (bağımsız, bağımsız) bağımlı değişken üzerindeki etkisini gösterir. Örneğin, ekonomik olarak aktif nüfus sayısının işletme sayısına, ücretlere ve diğer parametrelere nasıl bağlı olduğu. Veya: yabancı yatırımlar, enerji fiyatları vb. GSYİH seviyesini nasıl etkiler?

Analiz sonucu önceliklendirme yapmanızı sağlar. Ve ana faktörlere dayanarak, öncelikli alanların gelişimini tahmin etmek, planlamak, yönetim kararları almak.

Gerileme olur:

doğrusal (y = a + bx);

parabolik (y = a + bx + cx 2);

üstel (y = a * exp(bx));

Güç (y = a*x^b);

hiperbolik (y = b/x + a);

logaritmik (y = b * 1n(x) + a);

üstel (y = a * b^x).

Excel'de bir regresyon modeli oluşturma ve sonuçları yorumlama örneğini ele alalım. Doğrusal bir regresyon türü ele alalım.

Görev. 6 işletmede aylık ortalama maaş ve işten ayrılan çalışan sayısı analiz edildi. Emekli çalışan sayısının ortalama maaşa bağımlılığının belirlenmesi gerekmektedir.

Doğrusal regresyon modeli aşağıdaki forma sahiptir:

Y \u003d 0 + a 1 x 1 + ... + a k x k.

Burada a, regresyon katsayılarıdır, x, etkileyen değişkenlerdir ve k, faktörlerin sayısıdır.

Örneğimizde Y işten ayrılanların göstergesidir. Etkileyen faktör ücretlerdir (x).

Excel, bir doğrusal regresyon modelinin parametrelerini hesaplamak için kullanılabilecek yerleşik işlevlere sahiptir. Ancak Analysis ToolPak eklentisi bunu daha hızlı yapacaktır.

Güçlü bir analitik aracı etkinleştirin:

1. "Ofis" düğmesine tıklayın ve "Excel Seçenekleri" sekmesine gidin. "Eklentiler".

2. Aşağıda, açılır listenin altında, "Yönetim" alanında "Excel Eklentileri" yazısı olacaktır (orada değilse, sağdaki onay kutusuna tıklayın ve seçin). Ve bir Git düğmesi. Tıklamak.

3. Kullanılabilir eklentilerin bir listesi açılır. "Analiz Paketi"ni seçin ve Tamam'a tıklayın.

Etkinleştirildiğinde, eklenti Veri sekmesi altında bulunacaktır.

Şimdi doğrudan regresyon analizi ile ilgileneceğiz.

1. Veri Analizi aracının menüsünü açın. "Gerileme"yi seçin.

2. Giriş değerlerini ve çıkış seçeneklerini (sonucun nerede gösterileceğini) seçmek için bir menü açılacaktır. Başlangıç verileri alanlarında, açıklanan parametrenin (Y) aralığını ve onu etkileyen faktörü (X) belirtiyoruz. Gerisi tamamlanabilir veya tamamlanmayabilir.

3. Tamam'ı tıklattıktan sonra, program hesaplamaları yeni bir sayfada görüntüleyecektir (geçerli sayfada görüntülenecek aralığı seçebilir veya çıktıyı yeni bir çalışma kitabına atayabilirsiniz).

Öncelikle R-kare ve katsayılarına dikkat ediyoruz.

R-kare belirleme katsayısıdır. Örneğimizde, 0,755 veya %75,5'tir. Bu, modelin hesaplanan parametrelerinin çalışılan parametreler arasındaki ilişkiyi %75,5 oranında açıkladığı anlamına gelmektedir. Belirleme katsayısı ne kadar yüksek olursa, model o kadar iyi olur. İyi - 0,8'in üzerinde. Zayıf - 0,5'ten az (böyle bir analiz pek makul kabul edilemez). Örneğimizde - "fena değil".

64.1428 katsayısı, incelenen modeldeki tüm değişkenlerin 0'a eşit olması durumunda Y'nin ne olacağını gösterir. Yani, modelde açıklanmayan diğer faktörler de analiz edilen parametrenin değerini etkiler.

-0,16285 katsayısı, X değişkeninin Y üzerindeki ağırlığını gösterir. Yani, bu modeldeki ortalama aylık maaş, -0,16285 ağırlıkla işten ayrılanların sayısını etkiler (bu, küçük bir etki derecesidir). “-” işareti olumsuz bir etkiyi gösterir: maaş ne kadar yüksekse, işten ayrılma o kadar az olur. Hangisi adil.