Thursday 14 December 2017

اللوس - مقابل - المتوسط المتحرك


هناك عدد من النهج لنمذجة السلاسل الزمنية. نحن نوجز بعض من الأساليب الأكثر شيوعا أدناه. الاتجاه، الموسمية، التحلل المتبقي نهج واحد هو تحلل السلاسل الزمنية في اتجاه، الموسمية، والمكون المتبقي. والتجانس الأسي الثلاثي مثال على هذا النهج. مثال آخر، يسمى لووس الموسمية، يقوم على المربعات الصغرى المرجح محليا ويناقشها كليفلاند (1993). نحن لا نناقش اللوز الموسمية في هذا الدليل. الطرائق القائمة على التردد هناك طريقة أخرى، تستخدم عادة في التطبيقات العلمية والهندسية، وهي تحليل السلسلة في مجال التردد. ويرد مثال على هذا النهج في نمذجة مجموعة بيانات نوع جيبية في دراسة حالة انحراف الحزمة. المؤامرة الطيفية هي الأداة الأساسية لتحليل التردد من السلاسل الزمنية. نماذج الانحدار الذاتي (أر) إن الأسلوب المشترك لنمذجة السلاسل الزمنية المتغيرة أحادية المتغير هو نموذج الانحدار الذاتي (أر): xt دلتا phi1 X phi2 X كدوتس فيب X عندما تكون (شت) هي السلسلة الزمنية، تكون (أت) ضوضاء بيضاء ودلتا اليسار (1 - مجموع ص في الحق) مو. مع (مو) يدل على عملية يعني. نموذج الانحدار الذاتي هو ببساطة الانحدار الخطي للقيمة الحالية للسلسلة ضد واحد أو أكثر من القيم السابقة للسلسلة. وتسمى قيمة (p) ترتيب نموذج أر. نماذج أر يمكن تحليلها مع واحدة من الطرق المختلفة، بما في ذلك التقنيات الخطية المربعات الصغرى القياسية. لديهم أيضا تفسير مباشر. نماذج المتوسط ​​المتحرك (ما) هناك أسلوب مشترك آخر لنمذجة نماذج السلاسل الزمنية المتغيرة أحادية المتغير وهو نموذج المتوسط ​​المتحرك: شت مو في - ثيتا A - ثيتا A - كدوتس - ثيتاق A، حيث (شت) هي السلسلة الزمنية (مو) ) هو متوسط ​​السلسلة، (A) هي عبارة عن ضوضاء بيضاء، و (theta1، و لدوتس، و ثيتاق) هي معلمات النموذج. وتسمى قيمة (q) ترتيب نموذج ما. أي أن نموذج المتوسط ​​المتحرك هو من الناحية المفاهيمية انحدار خطي للقيمة الحالية للسلسلة ضد الضوضاء البيضاء أو الصدمات العشوائية لقيمة أو أكثر من القيم السابقة للسلسلة. ويفترض أن الصدمات العشوائية في كل نقطة تأتي من نفس التوزيع، وهو عادة توزيع طبيعي، مع موقع في الصفر ومقياس ثابت. ويتمثل التمييز في هذا النموذج في أن هذه الصدمات العشوائية يتم نشرها على القيم المستقبلية للسلاسل الزمنية. تركيب تقديرات ما هو أكثر تعقيدا من مع نماذج أر لأن شروط الخطأ غير قابلة للرصد. وهذا يعني أن إجراءات التكرار غير الخطية المتكررة تحتاج إلى استخدامها بدلا من المربعات الصغرى الخطية. نماذج ما أيضا تفسير أقل وضوحا من نماذج أر. في بعض الأحیان یقترح أسف و باسف أن نموذج ما سیکون خیار نموذج أفضل وأحيانا ینبغي استخدام کل من المصطلحات أر و ما في نفس النموذج (انظر القسم 6.4.4.5). ومع ذلك، لاحظ أن عبارات الخطأ بعد ملاءمة النموذج يجب أن تكون مستقلة وتتبع الافتراضات القياسية لعملية أحادية المتغير. قام بوكس ​​وجينكينز بنشر نهج يجمع بين المتوسط ​​المتحرك ونهج الانحدار الذاتي في كتاب تحليل السلاسل الزمنية: التنبؤ والتحكم (بوكس، جينكينز، و راينزيل، 1994). وعلى الرغم من أن كلا من نهجي الانحدار الذاتي والمتوسط ​​المتحرك كانا معروفين بالفعل (وقد تم التحقيق فيهما في الأصل من قبل يول)، فإن مساهمة بوكس ​​وجينكينز كانت في وضع منهجية منهجية لتحديد وتقدير النماذج التي يمكن أن تتضمن كلا النهجين. وهذا يجعل نماذج بوكس ​​جينكينز فئة قوية من النماذج. وستناقش الأقسام التالية هذه النماذج بالتفصيل. لوس هي واحدة من العديد من أساليب النمذجة الحديثة التي تبني على الأساليب الكلاسيكية، مثل الخطية وغير الخطية المربعات الصغرى الانحدار. تم تصميم طرق الانحدار الحديثة لمعالجة الحالات التي لا تؤدي فيها الإجراءات الكلاسيكية أداء جيدا أو لا يمكن تطبيقها بشكل فعال بدون عمل لا مبرر له. لويس يجمع بين الكثير من بساطة الخطية المربعات الصغرى الانحدار مع مرونة الانحدار غير الخطية. وهو يفعل ذلك عن طريق تركيب نماذج بسيطة للمجموعات الفرعية المترجمة من البيانات لبناء وظيفة تصف الجزء الحتمي للتغير في البيانات. نقطة بنقطة. في الواقع، واحدة من أهم عوامل الجذب في هذا الأسلوب هو أن محلل البيانات غير مطلوب لتحديد وظيفة عالمية من أي شكل لتناسب نموذج للبيانات، فقط لتناسب شرائح من البيانات. والمقايضة لهذه الميزات هي زيادة الحساب. ولأنه مكثف من الناحية الحسابية، فقد كان من المستحيل عمليا استخدام لويس في العصر الذي كان يجري فيه تطوير أقل انحدار للمربعات. معظم الأساليب الحديثة الأخرى لنمذجة العملية مماثلة ل لويس في هذا الصدد. وقد صممت هذه الأساليب بوعي لاستخدام قدرتنا الحسابية الحالية لتحقيق أقصى قدر ممكن من المزايا لتحقيق الأهداف التي لا يمكن تحقيقها بسهولة من خلال النهج التقليدية. تعريف لويس نموذج لوس، اقترح أصلا من قبل كليفلاند (1979) ومواصلة تطويرها من قبل كليفلاند وديفلين (1988). يشير بشكل خاص إلى طريقة (إلى حد ما) أكثر وصفا باسم الانحدار متعدد الحدود المرجح محليا. وعند كل نقطة في مجموعة البيانات، تكون الحدود متعددة الحدود ملائمة لمجموعة فرعية من البيانات، مع قيم متغيرة تفسيرية بالقرب من النقطة التي يجري تقدير استجابتها. وتتناسب حدود الحدود باستخدام المربعات الصغرى المرجحة، مما يعطي وزنا أكبر للنقاط القريبة من النقطة التي يتم تقدير استجابتها وخفض الوزن إلى نقاط أبعد من ذلك. وعندئذ يتم الحصول على قيمة دالة الانحدار للنقطة عن طريق تقييم الحدود المتعددة المحلية باستخدام القيم المتغيرة التفسيرية لنقطة البيانات هذه. ويكتمل لويس بعد حساب قيم دالة الانحدار لكل نقطة من نقاط البيانات (n). العديد من تفاصيل هذه الطريقة، مثل درجة نموذج متعدد الحدود والأوزان، مرنة. يتم مناقشة مجموعة الخيارات لكل جزء من الطريقة والقيم الافتراضية الافتراضية لفترة وجيزة بعد ذلك. مجموعات فرعية محلية من البيانات يتم تحديد مجموعات فرعية من البيانات المستخدمة لكل المربعات الصغرى المرجح في لويس من قبل أقرب خوارزمية الجيران. وتحدد المدخلات التي يحددها المستخدم للإجراء المسمى معلمة النطاق الترددي أو التمهيد مقدار البيانات المستخدمة لتتناسب مع كل حدود حدودية محلية. معامل التمهيد (q) هو رقم بين ((d1) n) و (1)، مع (d) يدل على درجة الحدود المحلية. قيمة (q) هي نسبة البيانات المستخدمة في كل مناسبة. وتتألف المجموعة الفرعية من البيانات المستخدمة في كل صالح من المربعات الصغرى المرجحة من النقاط (نك) (مقربة إلى أكبر عدد صحيح) التي تكون قيم المتغيرات التفسيرية فيها أقرب إلى النقطة التي يجري فيها تقدير الاستجابة. (q) معلمة التمهيد لأنها تتحكم في مرونة وظيفة الانحدار لوس. القيم الكبيرة من (q) تنتج أسلس الوظائف التي تذبذب أقل استجابة للتقلبات في البيانات. وكلما كان أصغر (q) كلما اقتربت وظيفة الانحدار من البيانات. استخدام قيمة صغيرة جدا من المعلمة تمهيد غير مرغوب فيه، ولكن، لأن وظيفة الانحدار سوف تبدأ في نهاية المطاف لالتقاط الخطأ العشوائي في البيانات. وتكمن القيم المفيدة لمعلمة التمهيد عادة في المدى من 0.25 إلى 0.5 بالنسبة لمعظم تطبيقات ليس. درجة تعدد الحدود المحلية إن الحدود المتعددة المحلية التي تناسب كل مجموعة فرعية من البيانات تكون دائما تقريبا من الدرجة الأولى أو الثانية، سواء كانت خطية محليا (بمعنى الخط المستقيم) أو من الدرجة الثانية محليا. باستخدام درجة صفرية متعدد الحدود يتحول ليس إلى المتوسط ​​المتحرك المرجح. مثل هذا النموذج المحلي البسيط قد يعمل بشكل جيد لبعض الحالات، ولكن قد لا تقارب دائما الوظيفة الأساسية بشكل جيد. وسوف تعمل حدود متعددة درجة أعلى من الناحية النظرية، ولكن نماذج العائد التي ليست حقا في روح لوس. ويستند لوس على الأفكار أن أي وظيفة يمكن تقريب بشكل جيد في حي صغير من متعدد الحدود ذات الترتيب المنخفض، وأن النماذج البسيطة يمكن أن يصلح للبيانات بسهولة. ومن شأن تعدد الحدود بدرجة عالية أن يميل إلى الإفراط في جمع البيانات في كل مجموعة فرعية وأن تكون غير مستقرة من الناحية العددية، مما يجعل من الصعب حساب حسابات دقيقة. كما ذكر أعلاه، فإن وظيفة الوزن يعطي أكبر وزن لنقاط البيانات الأقرب إلى نقطة التقدير وأقل وزن لنقاط البيانات التي هي أبعد. ويستند استخدام الأوزان إلى فكرة أن النقاط بالقرب من بعضها البعض في المساحة المتغيرة التفسيرية هي أكثر احتمالا أن تكون ذات صلة ببعضها البعض بطريقة بسيطة من النقاط التي هي أبعد من ذلك. بعد هذا المنطق، النقاط التي من المرجح أن تتبع النموذج المحلي أفضل تؤثر على تقديرات نموذج المحلية المحلية أكثر من غيرها. النقاط الأقل احتمالا لتتوافق مع النموذج المحلي لها تأثير أقل على تقديرات معلمات النموذج المحلي. وظيفة الوزن التقليدية المستخدمة ل لويس هي وظيفة الوزن ثلاثي المكعب، w (x) اليسار (1 - x3) 3 مبوكسميك، أولا تثبيت R (إذا لم تكن بالفعل)، تشغيل R وتثبيت حزمة تيتشينغديموس (بالضبط كيف يعتمد على النظام الخاص بك)، تحميل الحزمة مع مكتبة (تيتشينغديموس) ثم اكتب loess. demo لإظهار صفحة المساعدة لمعرفة كيفية تشغيله، يمكنك التمرير إلى أسفل حيث المثال ونسخ ولصق هذا الرمز إلى الأمر R39s خط لرؤية الأمثلة، ثم تشغيل مع البيانات الخاصة بك لمزيد من استكشاف. نداش غريغ سنو مار 23 12 في 17:15 هنا هو استجابة بسيطة ولكنها مفصلة. نموذج خطي يناسب العلاقة من خلال جميع نقاط البيانات. يمكن أن يكون هذا النموذج من الدرجة الأولى (معنى آخر للخطي) أو متعدد الحدود لحساب الانحناء، أو مع الخطوط العريضة لحساب المناطق المختلفة التي لديها نموذج حكم مختلف. تناسب لويس هو الانحدار المرجح المرجح محليا استنادا إلى نقاط البيانات الأصلية. وهذا يعني أن مدخلات لويس تناسب قيمتي X و Y الأصلية، بالإضافة إلى مجموعة من قيم X للإخراج التي تحسب قيم Y الجديدة (عادة ما تستخدم القيم X نفسها لكلا الأمرين، ولكن غالبا ما تستخدم قيم X أقل للأزواج زي المجهزة بسبب زيادة الحساب المطلوب). ولكل قيمة X من الخرج، يستخدم جزء من بيانات الدخل لحساب مدى ملاءمة. الجزء من البيانات، عموما 25 إلى 100 ولكن عادة 33 أو 50، هو محلي، وهذا يعني أن هذا الجزء من البيانات الأصلية الأقرب إلى كل قيمة إخراج X معينة. وهو تناسب متحرك، لأن كل قيمة إخراج X يتطلب مجموعة فرعية مختلفة من البيانات الأصلية، مع أوزان مختلفة (انظر الفقرة التالية). وتستخدم هذه المجموعة الفرعية من نقاط بيانات المدخلات لإجراء انحدار مرجح، حيث تكون النقاط الأقرب إلى قيمة الخرج X تعطي وزنا أكبر. هذا الانحدار هو عادة من الدرجة الثانية من الدرجة الثانية أو أعلى من الممكن، ولكنها تتطلب قوة حسابية أكبر. يتم استخدام قيمة Y لهذا الانحدار المرجح المحسوب عند المخرجات X كقيمة نماذج Y لهذه القيمة X. ويعاد حساب الانحدار عند قيمة كل ناتج X لإنتاج مجموعة كاملة من قيم النواتج Y. أجابيد فبراير 21 15 في 21:08

No comments:

Post a Comment