ما مدام دادههای فراوانی برای پروژههای خویش نداریم. اکثر زمان ها، ما صرفا یک تیم داده مثال داریم که به جهت کمبود منابع برای اجرا آزمایشات مکرر (مانند تست A/B) با آن شغل کنیم.
خوشبختانه، ما طریقهای مثالگیری دوباره داریم تا از هر دادهای که داریم بیشترین استعمال را بکنیم. طراحی سایت در مشهد بوت استرپینگ یک تکنیک مثال گیری دوباره است که در حالتی که که سبک خویش را صرفا یکبار بر روی مثال اساسی در اختیار بگذاریم، داده ها دیگری در چنگ ما قرار میدهد.
در حالی که ممکن است ما با «چه» و «چهطور» پشت بوت استرپینگ آشنا باشیم، غرض این نوشتهعلمی ارائه «چرایی» طراحی سایت بوت استرپینگ به طریقای غیر انسانی هست.
تودهبندی سریع بوت استرپینگ
مقصود از بوت استرپ ایجاد یک تقریب (از جمله معدل مثال x) برای پارامتر جمعیت (مثلا، معدل جامعه θ) براساس یک سری مثال داده بهدستآمده از مثال اساسی میباشد.
بوت استرپینگ با مثالبرداری مکرر (با جایگزینی) مجموعه داده مثال برای تشکیل داد مثالهای مشابهسازی گردیده انجام می شود. هر مثال بوت استرپ مشابهسازی گردیده برای احتساب تقریب پارامتر به کارگیری میشود و آنگاه این برآوردها مخلوط میگردند تا یک توزیع مثالبرداری را تشکیل دهند.
آنگاه توزیع مثالگیری بوت استرپ به ما اذن می دهد تا استنتاجهای آماری مانند برآورد خطای استاندارد پارامتر را بدست آوریم.
فرآیند خودراه انداز | تصویر از مولف
عکس ۲:
چرا بوت استرپینگ فعالیت مینماید؟
شما می بایست تعجب فرمایید، چه طور شغل مثالگیری مکرر از یک دسته داده مثال به ما اذن میدهد تا راجع به داده های عددی جمعیت استنتاج کنیم؟
در حالت ایدهآل، ما میخواهیم چندین مثال مستقل از دنیای حقیقی وواقعی را از جمعیت حقیقی بگیریم تا داده های عددی جمعیت را درک کنیم. با این اکنون، ما پیش از این اثبات کردهایم کهاین شغل ممکن میباشد مدام ممکن نباشد.
براین اساس، ما بایستی با گروه دادههای مثال خودکار کنیم، که تبدیل به شایسته ترین (و فقط) اطلاعاتی میگردد که دربارهی جمعیت داریم.
منطقی میباشد فرض کنیم که بیشتر مثالها (چنانچه به طور تصادفی کشیده شوند) نسبتاً مشابه جمعیتی خواهند بود که از آن منشا می گیرند. با پیش گویی این مسئله، بهاین مضمون است که دادههای مثال مارا میتوان تحت عنوان جمعیتی در لحاظ گرفت که ما وانمود می کنیم جمعیت حقیقی را نشان میدهد.
با این جمعیت تظاهر کننده قادر خواهیم بود مثالهای تصادفی چندگانه (بوت استرپ) را از آن ترسیم کنیم. این به سیرتکاملای میباشد که گویی ما چند مثال از جمعیت واقعی را به دست میاوریم.
اعتنا: در واقعیت، مثال اساسی فقط یک مثال میباشد که ما از جمعیت حقیقی و واقعی داریم.
ازآنجاکه مثالبرداری با جایگزینی مجاز میباشد، مثالهای بوت استرپ را میاقتدار تحت عنوان مثالهای تصادفی ساخت گردیده پایین شیوهها و فرض ها مختلف در لحاظ گرفت.
داده ها عدهآوریگردیده مثالبرداری گردیده از این مثالهای بوت استرپ در غایت به ما کمک خواهد کرد تا برآوردهای دقیقی از پارامتر جمعیت، مثلا معدل جمعیت، به دست آوریم.
عکس ۳: تصویر از یک پیشگفتار به یادگیری آماری-بازنویسی دوم
پس مثالبرداری بوت استرپ چقدر مفید میباشد؟ تصویر بالا برآوردهای پارامتر (α) را از ۱۰۰۰ مثال مشابهسازی گردیده از جمعیت حقیقی در مقابل ۱۰۰۰ مثال بوت استرپ مقایسه مینماید.
می توانیم ببینیم که نمودارهای میلهای دارنده گسترههای مشابهی می باشند، که نشانه میدهد روش بوت استرپ قادر است به صورت موثری تغییرپذیری مرتبط با برآورد پارامتر را برآورد نماید.
خلاصه
درین نوشتهی علمی، ما یک توضیح ساده از شهود پشت بوت استرپینگ را پژوهش کردیم. امیدوارم کهاین تایپ کردن شعور بهتری از بوت استرپینگ و اینکه چرا از نگاه تئوری و عملی فعالیت مینماید، به شما بدهد.
معنی کلیدی این میباشد که فرض میگردد مثال اساسی نماینده جمعیت باشد. با مثالگیری دوباره این مثال چندبار، ما یک توزیع مثالگیری نسبتا ظریف از تقریب مثال پارامتر جمعیت بدست میآوریم.
اما، یک سری هشدار دراین باره وجود داراست. برای مثال، در موقعیت معمولی مثالگیری از جمعیت واقعی، ما هیچ وقت یک مثال به اندازه تمام جمعیت نخواهیم گرفت. با این فعلا، به کارگیری از اندازه مثال شبیه با گروه داده مهم در بوت استرپینگ رایج می باشد.
برای جزئیات بیشتر در باب هشدارهای متفاوت، می توانید این گزینه را در اینجا رسیدگی فرمایید.