ساخت سیستم توصیه گر سیستم های توصیه کننده: آنها چه هستند؟ درباره آموزش آنلاین، مزایا، معایب و مشکلات آن

هنگامی که سیستم های توصیه به تازگی شروع به پیاده سازی بدون مزاحمت بر روی منابع مختلف می کردند، به نظر می رسید که افزوده خوبی به فرآیند جستجوی خود باشد. وقتی انتخاب محصولات یا هر محتوا به اندازه کافی بزرگ باشد، جستجو به یک سفر هیجان انگیز با نتایج اغلب غیرقابل پیش بینی تبدیل می شود. به عنوان مثال، من هرگز به فیلم های ترسناک علاقه مند نبودم، فیلم هایی با جهت کمی متفاوت را ترجیح می دادم، با این حال، به لطف کاوش تصادفی در محتوا، یک روز با یک فیلم کلاسیک روبرو شدم. Hellraiser، تماشای گاه به گاه آن تأثیری قوی و پاک نشدنی بر من گذاشت. من مطمئن هستم که هر یک از خوانندگان حداقل یک بار دقیقاً به لطف جستجوی تصادفی و اقدامات تصادفی از نظر فرهنگی یا زیبایی شناختی غنی شده اند. از طرفی به کمک توصیه هایی که منابع موضوعی به من می دهند، چیزهای جالب زیادی کشف کردم. بسیاری از فیلم‌ها، کتاب‌ها، موسیقی‌ها یا محصولات تنها به دلیل عملکرد موفقیت‌آمیز سیستم توصیه برای من (و جالب) شناخته شدند. آنچه معمول است این است که اکنون تقریباً همیشه به توصیه‌ها تکیه می‌کنم و خیلی کمتر به دنبال چیزی می‌گردم، زیرا زمان دیگری برای دومی باقی نمی‌ماند!

این وضعیت با این واقعیت تشدید می شود که می بینم الگوریتم های توصیه تا چه حد شروع به درک من کرده اند. اگر موفقیت‌های قبلی چندان زیاد اتفاق نمی‌افتاد، امروز حداقل نیمی از موارد توصیه شده تا حدی به من علاقه‌مند است. و وقتی هنوز سعی می‌کنم، به‌جای اینکه بی‌علاقه آنچه را که به من پیشنهاد می‌شود بپذیرم، به تنهایی چیزی ارزشمند پیدا کنم، به سرعت تحت فشار فراوانی باورنکردنی و بی‌سابقه تسلیم می‌شوم. و هر چه جلوتر می روید، تصویر واضح تری از آینده ای نه چندان دور نمایان می شود، زمانی که واقعیت اطراف به طور مداوم با شخصیت شما سازگار می شود و دائماً در حال تغییر و یادگیری است. هرگز پیش از این در تاریخ بشریت آسایش به این حد تهدیدآمیز مطلق نبوده است. و هرگز پیش از این هرگز حفره هایی برای یافته های تصادفی باورنکردنی به این سرعت و قاطعانه از استفاده حذف نشده بود.

با پذیرفتن آینده آتی همانطور که هست، ارزش یادگیری ارزیابی انتقادی آن، شناسایی مشکوک یا حتی آن را دارد طرف های تاریکبا همان غیرتی که با آن می کوشیم از نوآوری هایی در زندگی روزمره استفاده کنیم که کار ما را آسان تر می کند. بیایید سعی کنیم موضوع گفتگوی امروزمان را بفهمیم.

روش های فیلتر مورد استفاده در سیستم های توصیه

فیلتر مشارکتی

فیلتر مشارکتی به طور گسترده ای مورد استفاده قرار می گیرد، به ویژه به دلیل سهولت نسبی اجرا. اصل عملکرد آن در واقع ساده است، اگرچه می توان آن را به دو رویکرد مختلف تقسیم کرد.

یک رویکرد مبتنی بر تطبیق کاربر (که معمولاً به عنوان کاربر محور شناخته می شود) شباهت یک کاربر معین را با سایر کاربران درگیر در سیستم در نظر می گیرد. به عنوان مثال، اگر واسیلی لیدی گاگا، اوسیس و لد زپلین را مثبت ارزیابی کرد، آناستازیا که عاشق لیدی گاگا و لد زپلین است، می‌تواند سعی کند Oasis را پیشنهاد کند.

مفهوم مقایسه شی (به ترتیب مبتنی بر آیتم)، برعکس، خود اشیاء را تجزیه و تحلیل می کند و شباهت آنها را با مواردی که زمانی واسیلی دوست داشت، آشکار می کند. در عمل، به نظر می رسد: واسیلی زمانی Radiohead و Blur را دوست داشت، چرا ما به او Oasis را نیز پیشنهاد نمی کنیم؟

فیلتر مشارکتی به شما این امکان را می دهد که بر اساس تجزیه و تحلیل و مقایسه تفاوت های کاربران با رفتار مشابه، توصیه های بسیار دقیق و مرتبطی دریافت کنید.

واسیلی و آناستازیا: توصیه های خودکار متقابل بر اساس تفاوت در ترجیحات.

فیلتر کردن محتوا

فیلتر محتوا ارتباطات داخلی بین محصولات پیشنهادی یا هر محتوایی ایجاد می کند. این اصل ساده خود را در توصیه به اشیایی به کاربر نشان می دهد که مشابه مواردی است که قبلاً انتخاب کرده بود. به عنوان مثال، اگر کتابچه راهنمای نواختن گیتار را در یک کتابفروشی خریداری کنید، به طور خودکار سایر آموزش ها یا کتابچه های راهنمای محبوب توسط همان نویسنده به شما ارائه می شود. مزیت بزرگ سیستم های توصیه ای که از اصل فیلتر کردن محتوا استفاده می کنند، توانایی علاقه مند کردن کاربر جدید به پیشنهادات به معنای واقعی کلمه از اولین مراحل مصرف کننده است. شما نیازی به جمع آوری اطلاعات در مورد ترجیحات یک فرد برای مدت طولانی ندارید؛ می توانید بلافاصله بازدیدکننده را در کار با منبع قرار دهید. همچنین، یکی از مزیت های مهم فیلتر محتوا، امکان توصیه به کاربر آن دسته از اشیایی است که توسط سایر کاربران رتبه بندی و ارسال نشده اند. نکته دوم اغلب هنگام استفاده از روش مشارکتی رخ می دهد.

فیلتر محتوا به طور کامل نظرات کاربران در مورد اشیاء خاص را نادیده می گیرد. با ایجاد ارتباطات صرفاً بین خود اشیا، ما این فرصت را داریم که فوراً، بدون جمع‌آوری رتبه‌بندی و اطلاعات شخصی اضافی، چیزی شبیه به موقعیت مورد علاقه‌اش را به فرد پیشنهاد دهیم. با حذف تجربه کاربر از سیستم توصیه به عنوان یک ماده اساسی، به نظر می رسد که به اصطلاح مشکل را حل کنیم. "شروع سرد"، زمانی که پراکندگی داده های کاربر مانع از ایجاد توصیه های شخصی توسط سیستم می شود. با این حال، جنبه منفی فیلتر محتوا کاملاً نامناسب و گاهی اوقات توصیه های کاملاً مضحک مانند «آیا تویوتا RAV4 خریده اید؟ همچنین ممکن است به تویوتا هایلندر علاقه مند باشید!»

یکی دیگر از مشکلات مرتبط با استفاده از اصل فیلتر محتوا، میزان قابل توجه کار در ایجاد ارتباط بین تمام اشیاء در سیستم است. اما بیشترین اشکال اصلیاین روش در یک ضربه بسیار کم و گاهی مشروط به هدف بیان می شود. فیلتر محتوا به معنای درجه بالایی از شخصی سازی نیست، بنابراین دقت توصیه ها نسبتاً پایین است.

فیلترینگ مبتنی بر دانش (دانشمستقر سیستم های)

از این نوع سیستم ها به طور گسترده در فروشگاه های آنلاین استفاده می شود. در اصل، توصیه‌های مبتنی بر دانش مشابه روش قبلی فیلتر محتوا هستند، با این حال، چنین الگوریتم‌هایی از تجزیه و تحلیل عمیق‌تری از اشیا استفاده می‌کنند و ارتباط بین آنها را نه بر اساس معیارهای پیش پا افتاده شباهت، بلکه بر اساس به هم پیوستگی گروه‌های خاصی از کالاها ایجاد می‌کنند. .

در عمل، به نظر می رسد - هنگام خرید، به عنوان مثال، یک گوشی هوشمند، سایت لوازم جانبی مناسب برای استفاده با دستگاه جدید شما را به شما ارائه می دهد. اینها می توانند کیس، هدفون، کارت حافظه و هر چیز دیگری باشند. علاوه بر این می توانید با ارائه تخفیف در لوازم جانبی، خریدار را تحریک کنید که می تواند در ارتباط با خرید دستگاه جدید بسیار مفید باشد.

توصیه های مبتنی بر دانش نتایج خوبی را نشان می دهد و گردش مالی شبکه های بزرگ را افزایش می دهد پلتفرم های معاملاتیده ها درصد علاوه بر این، بر خلاف فیلتر محتوا، این نوع توصیه دارای است دقت بالا، چیزی را به کاربر ارائه می دهد که ممکن است واقعاً برای او مفید باشد.

اگر به توصیه های دقیق علاقه مند هستید، پس حتما باید یک سیستم دانش محور را در وب سایت خود پیاده سازی کنید. مانند فیلتر محتوا، یک سیستم توصیه مبتنی بر دانش روابط بین اشیاء (محصولات) را مطالعه و تجزیه و تحلیل می کند، اما علاوه بر این، تعدادی گزینه اضافی مربوط به ویژگی های فردی یک کاربر خاص را در نظر می گیرد.

الف) خواسته های کاربر. موقعیتی که برای همه آشناست - سایت از کاربر می خواهد ویژگی های مورد نظر خود را نشان دهد و پس از آن محصولاتی را ارائه می دهد که با درخواست مطابقت دارند.

Yandex.Market و چک باکس‌های آن نمونه‌ای موفق و بارز از سیستم توصیه‌هایی هستند که بر اساس نیازهای کاربر هدایت می‌شوند.

ب) ویژگی های جمعیتی.در واقع، داده های جمعیتی توسط شبکه های اجتماعی بزرگ مانند فیس بوک، لینکدین، VKontakte و دیگران برای ارائه توصیه ها استفاده می شود.

البته، برای پیاده سازی چنین سیستمی باید سخت کار کنید - باید حجم عظیمی از داده ها را جمع آوری و پردازش کنید.

فیلتراسیون هیبریدی

قوی ترین و سخت ترین ابزار برای پیاده سازی. ظاهرا، آینده در ترکیب مکانیسم های مختلف توصیه در یک الگوریتم واحد قدرتمند نهفته است. آن راحتی مطلق و واقعیت شخصی که در ابتدای مقاله در مورد آن صحبت کردیم دقیقاً با کمک ترکیبی از بهترین ها تحقق خواهد یافت. روش های موثرتوصیه ها

چنین مثالی توسط Netflix نشان داده شده است، که سیستم پیچیده توصیه ترکیبی آن، که دقت منحصر به فردی را نشان می دهد، دائما در حال بهبود و مدرنیزه شدن است. توسعه چنین الگوریتم قدرتمندی تا حد زیادی به دلیل تامین مالی سخاوتمندانه تحقیقات در این زمینه توسط خود نتفلیکس است که در سال 2006 مبلغ 1,000,000 دلار برای بهبود سیستم توصیه خود به میزان 10% پیشنهاد داد.

تیم توسعه Pragmatic Chaos BellKor که موفق به بهبود الگوریتم شدنتفلیکس10.09٪.

چند کلمه در مورد مراحل عملی به عنوان نتیجه گیری

انتخاب نوع خاصی از فیلتراسیون یا ترکیبی از چندین روش به طور مستقیم به دو عامل بستگی دارد - پیچیدگی پروژه شما و میزان بودجه آن. به عنوان مثال، ایجاد یک الگوریتم برای سیستمی از وبلاگ های موضوعی که با یکدیگر تلاقی می کنند، یک کار نسبتاً ساده و نسبتاً گران است. پروژه‌های بزرگ‌تر و ناهمگون‌تر، مانند فروشگاه‌های آنلاین، به هزینه‌های بیشتری نیاز دارند، به‌ویژه اگر هدف افزایش تبدیل به میزان واقعی باشد. به عنوان یک قاعده، در چنین پروژه هایی نمی توان خود را تنها به یک نوع الگوریتم توصیه محدود کرد و باید از فیلتر ترکیبی استفاده کرد، در نتیجه هزینه و پیچیدگی توسعه با مرتبه بزرگی افزایش می یابد.

برای ایجاد، پیاده‌سازی و اشکال‌زدایی یک الگوریتم ترکیبی، به یک تیم کامل از توسعه‌دهندگان با تجربه نیاز دارید که به خوبی از جبر خطی و رابطه‌ای آگاه باشند و همچنین دارای طیف وسیعی از مهارت‌ها باشند که سازندگان الگوریتم‌های توصیه را عملاً به یک حرفه جداگانه تبدیل کنند.

به هر حال، هنگام توسعه پروژه ای که به کاربر امکان انتخاب اشیاء خاص از یک مجموعه کلی را ارائه می دهد، لازم است پیشرفت سریع قابلیت استفاده در مطلقاً همه حوزه های زندگی انسان - از بهینه سازی خواب با کمک در نظر گرفته شود. دستگاه هایی که تمام فرآیندهای رخ داده در خواب را تجزیه و تحلیل می کنند و توصیه هایی برای بهبود آن صادر می کنند تا به طور خودکار کالاهای روزمره را بر اساس نیازهای فعلی کاربر انتخاب کنند. همانطور که می دانید شرط لازم برای موفقیت هر کاری مطابقت دقیق آن با روح زمان است.

بیایید با تعریف سیستم های توصیه گر شروع کنیم. اینها برنامه‌ها و سرویس‌هایی هستند که سعی می‌کنند مشخص کنند که کاربران چه چیزی را می‌خواهند ببینند و آن را به آنها ارائه دهند (یا آن را توصیه کنند، از این رو نام آن را به شما پیشنهاد می‌کنند). هر یک از ما احتمالا در سایت های مختلف با تکنیک های مشابهی مواجه شده ایم. امروز انواع و اصول عملکرد چنین برنامه هایی را شرح می دهیم و همچنین نمونه هایی از این الگوریتم ها را در عمل بیان می کنیم. تا آخر بخوانید جالب می شود!

در بالا توضیح دادیم که سیستم های توصیه گر چیست، اکنون با جزئیات بیشتری در مورد اهمیت آنها به شما خواهیم گفت. این برنامه ها نحوه تعامل سایت و بازدیدکننده را بهبود بخشیده اند زیرا به جای ارائه اطلاعات ثابت، کاربر یک تجربه تعاملی دریافت می کند.

توصیه ها به طور جداگانه برای هر فرد، بر اساس اقدامات قبلی او در یک منبع وب خاص یا بر اساس فعالیت های گذشته، ایجاد می شود. علاوه بر این، رفتار شرکت کنندگان قبلی در فرآیند نیز مهم است.

برای فروشگاه های آنلاین، در اصل، این یک عملکرد مهم است، و برای کاتالوگ های بزرگ مانند آمازون، یکی از معدود راه های کارآمد است. روش توصیه در این مورد یک گزینه اضافی معمولی نیست؛ این روش ناوبری کاربر را از طریق منبع وب آسان می کند. اگر کاتالوگ الکترونیکی حاوی بیش از 20000 نام محصول باشد، جهت گیری در حال حاضر بسیار دشوار به نظر می رسد، اگر میلیون ها محصول وجود دارد چه می توانیم بگوییم؟

تعامل یک خریدار بالقوه با چنین سایتی چقدر خسته کننده است؟ پاسخ واضح است. و ویجتی برای جستجوی محصولاتی که از نظر بصری شبیه محصول مورد نظر شما هستند یا متعلق به همان گروه از محصولات یا محصولات مکمل هستند (مثلاً وقتی به شما پیشنهاد می شود یک کیف دستی برای یک جفت کفش انتخاب کنید) ارائه می شود. برای نجات. این راه حل نه تنها تعداد بازدیدها را افزایش می دهد، بلکه تأثیر مثبتی بر تبدیل دارد.

همانطور که تمرین نشان می دهد، نه تنها فروشگاه های آنلاین از این تکنیک استفاده می کنند. رسانه های اجتماعینیز عقب نمانده اند. در زیر نمونه ای از VKontakte آورده شده است.

همچنین، تکنیک های مشابه را می توان به راحتی در پلتفرم های مختلف اجتماعی، پورتال های اختصاص داده شده به ادبیات، سفر، منابع خبری، فروشگاه های آنلاین، در یک کلام - تقریباً در همه جا مشاهده کرد. این تکنیک واقعاً بسیار محبوب است. منبع وب Kinopoisk نمونه قابل دسترس دیگری است.

تکنیک

بنابراین، نوع اول جمع آوری داده های صریح است. همانطور که ممکن است از نام آن حدس بزنید، خود کاربر مواد لازم برای کار را فراهم می کند. به عنوان مثال، هنگامی که سیستم های توصیه Yandex یا سایر موتورهای جستجو از شخصی می خواهند که عناصر مختلف را رتبه بندی کند، لیستی از موارد دلخواه در یک منطقه خاص تهیه کند یا به چندین سؤال پاسخ دهد. اگر شخصی از دادن اطلاعات به تنهایی امتناع کند، تکنیک زیر مرتبط خواهد بود.

نوع دوم جمع آوری داده های ضمنی است. به طور نسبی، این یک ماموریت جاسوسی است که طبق آن اقدامات یک شرکت کننده در فرآیند توسط یک برنامه برای پردازش و کاربرد بیشتر ثبت می شود. برای این به چه چیزی نیاز دارید؟ این برنامه خریدها، رتبه بندی سایت ها را شناسایی می کند، اطلاعات بازدیدها و نظرات را جمع آوری می کند. البته انتخاب چنین تکنیکی مستلزم برخی موارد است مسائل اخلاقی، زیرا حفاظت از داده های شخصی یکی از الزامات اصلی است که کاربر در موتورهای جستجو قرار می دهد. اما در حال حاضر، این واقعیت باقی است که نوعی نظارت امکان پذیر است و بازدیدکنندگان عادی وب سایت نمی توانند بررسی کنند که آیا چنین رویدادهایی واقعاً در حال وقوع هستند یا خیر.

اولین تکنیک اساسی فیلترینگ مشارکتی نام دارد. توصیه هایی با استفاده از این تکنیک بر اساس ویژگی های رفتاری یک فرد یا گروهی از افراد ارائه می شود که مورد دوم حتی موثرتر است. گروه ها افرادی را جمع می کنند که از نظر رفتار و خصوصیات مشابه هستند.

بیایید مثالی بزنیم تا اطلاعات را راحت تر درک کنیم. وب سایتی در حال ایجاد است که در آن آثار موسیقی به مخاطبان توصیه می شود. خدمات توصیه بر اساس روش شناسی مشارکتی در این مورد چگونه کار خواهد کرد؟ طبق این اصل: یک انجمن به عنوان پایه در نظر گرفته می شود که در آن شرکت کنندگان آهنگ هایی از همان سبک را به لیست پخش اضافه می کنند. در مرحله بعد، محبوب ترین قطعات موسیقی مشخص می شود و به یک کاربر از گروه که هنوز این ملودی را گوش نکرده است، توصیه می شود.

رویکرد دوم فیلترینگ مبتنی بر محتوا نام دارد. در اینجا توصیه بر اساس رفتار انسان شکل می گیرد. این رویکرد همچنین می‌تواند سابقه مرور یک شرکت‌کننده خاص را به عنوان مبنایی در نظر بگیرد.

این بار با مجلات اینترنتی موضوعی مثال می زنیم. بنابراین، در صورتی که شخصی قبلاً مطالبی در مورد دوچرخه سواری کوهستان خوانده باشد و مرتباً در مورد مقالات وبلاگ با چنین محتوایی نظر داده باشد، روش فیلتر محتوا از این اطلاعات گذشته برای شناسایی منابع مشابه استفاده می کند و به عنوان توصیه برای آن کاربر به او پیشنهاد می کند. .

همچنین رویکردهای ترکیبی وجود دارد که بر اساس آنها توسعه یک سیستم توصیه انجام می شود.

رویکرد ترکیبی ترکیبی از فیلتر مشارکتی و محتوا است. همانطور که می دانیم، بیشتر بهتر است، بنابراین اختلاط این دو تکنیک کارایی سیستم های توصیه را افزایش می دهد، یعنی به طور قابل توجهی دقت پیش بینی ها را برای افراد خاص افزایش می دهد.

الگوریتم ها

همبستگی پیرسون

این الگوریتم به شما امکان انتخاب می دهد خصوصیات عمومیبین چند کاربر چگونه؟ با استفاده از ریاضیات ساده، یعنی تعیین رابطه خطی بین دو عنصر. یک نکته مهم این است که این تکنیک برای جامعه ای از افراد مناسب نیست.

خوشه بندی

این اصل عملکرد سیستم‌های توصیه‌گر مبتنی بر شناسایی شباهت‌های بین عناصر (کاربران) با محاسبه نزدیکی آنها به یکدیگر در فضای به اصطلاح ویژگی است. نشانه ها آن دسته از عناصری هستند که منافع برخی از شرکت کنندگان در فرآیند بر روی آنها همگرا می شود (برای منابع موسیقی این آهنگ ها، برای پورتال های فیلم - فیلم ها هستند). کاربران با ویژگی های مشابه در خوشه های به اصطلاح ترکیب می شوند.

الگوریتم فیلتر مشارکتی

خوشه بندی سخت را می توان با الگوریتم دیگری جایگزین کرد که طبق یک فرمول نسبتاً پیچیده کار می کند و مانند همه موارد قبلی بر اساس رفتار کاربران از گروه خود است. با این حال، این تکنیک دارای چندین معایب نسبتا قابل توجه است. اولاً، یافتن توصیه‌ها برای کاربران جدید یا غیرمعمول (کسانی که گروه تشکیل نمی‌دهند) دشوار است. در مرحله دوم، به اصطلاح "شروع سرد"، زمانی که اشیاء جدید وارد سیستم های توصیه نمی شوند.

الگوریتم فیلتر محتوا

الگوریتم متقارن با الگوریتم قبلی است، اما اگر در مورد اول از این فرض شروع کنیم که کاربر شی را دوست دارد زیرا "همکلاسی های" او آن را دوست دارند، در اینجا ما بر اساس اشیاء مشابهی که قبلاً برای آنها اشاره کرده است توصیه می کنیم. خودش و در اینجا، به طور سنتی، چندین مشکل را می توان شناسایی کرد. همان "شروع سرد" و این واقعیت که توصیه ها اغلب پیش پا افتاده هستند.

به جای نتیجه گیری

بنابراین، ما تمام اطلاعاتی را که یک مبتدی یا یک فرد ساده باید در مورد سیستم های توصیه بداند، ارائه کرده ایم. بیایید صادق باشیم، الگوریتم ها برای یک فرد آموزش ندیده تا حدودی دشوار هستند، بنابراین این مقاله حاوی فرمول های ریاضی نیست، اگرچه الگوریتم ها بر اساس آنها هستند.

برنامه های توصیه خدمات مفیدی هم برای کاربران عادی اینترنت و هم برای محققان و تاجران آنلاین هستند. کسانی که قصد افزایش تبدیل و تعداد بازدید را دارند باید به این تکنیک توجه کنند و حتماً آن را پیاده سازی کنند تا کارایی یک منبع وب به خصوص یک فروشگاه آنلاین افزایش یابد.

دو استراتژی اصلی برای ایجاد سیستم های توصیه گر وجود دارد: فیلتر محتوا و فیلتر مشارکتی.

در فیلتر کردن محتوادر حال ایجاد هستند پروفایل هاکاربران و اشیاء

  • نمایه های کاربر ممکن است شامل اطلاعات جمعیت شناختی یا پاسخ به مجموعه خاصی از سوالات باشد.
  • نمایه های شی می تواند شامل نام ژانر، نام بازیگر، نام هنرمند و غیره باشد. - بسته به نوع شی.

این رویکرد در پروژه استفاده می شود پروژه ژنوم موسیقی: یک تحلیلگر موسیقی هر آهنگ را بر اساس صدها ویژگی مختلف موسیقی ارزیابی می کند که می توان از آنها برای شناسایی ترجیحات موسیقی کاربر استفاده کرد.

در فیلتر مشارکتیاطلاعات مربوط به رفتار کاربر گذشته استفاده می شود - برای مثال، اطلاعات مربوط به خریدها یا رتبه بندی ها. در این مورد، مهم نیست که با چه نوع اشیایی کار می‌شود، اما می‌توان ویژگی‌های ضمنی را که در نظر گرفتن آنها هنگام ایجاد نمایه دشوار است، در نظر گرفت. مشکل اصلی این نوع از سیستم های توصیه "شروع سرد" است: کمبود داده در مورد کاربران یا اشیایی که اخیراً در سیستم ظاهر شده اند.

روش شناسی

نمونه هایی از جمع آوری داده های صریح

  • درخواست از کاربر برای ارزیابی شی در مقیاس متمایز؛
  • درخواست از کاربر برای رتبه بندی گروهی از اشیا از بهترین به بدترین؛
  • ارائه دو شی به کاربر و پرسیدن اینکه کدام یک بهتر است.
  • پیشنهادی برای ایجاد لیستی از اشیایی که کاربر دوست دارد.

نمونه هایی از جمع آوری داده های ضمنی

  • نظارت بر آنچه کاربر در فروشگاه های آنلاین یا انواع دیگر پایگاه های داده مشاهده می کند.
  • نگهداری سوابق رفتار آنلاین کاربر؛
  • ردیابی محتویات رایانه کاربر؛

کاربرد

سیستم های توصیه کننده داده های مشابه را از مردم مختلفو لیستی از توصیه ها را برای یک کاربر خاص محاسبه کنید. چند نمونه از استفاده تجاری و غیرتجاری آنها در مقاله فیلتر مشارکتی آورده شده است. سیستم‌های توصیه جایگزین مناسبی برای الگوریتم‌های جستجو هستند، زیرا به شما امکان می‌دهند اشیایی را که در آخر یافت نمی‌شوند شناسایی کنید. جالب است که سیستم های توصیه گر اغلب از موتورهای جستجو برای فهرست بندی داده های غیر معمول استفاده می کنند.

  • ایمهونت (فیلم، ادبیات، عکس)
  • Last.fm (موسیقی)
  • اوزون (کتاب، سی دی و غیره)
  • اطلاع رسانی نرم افزار (نرم افزار)
  • آزمایشگاه علمی تخیلی (سایت علمی تخیلی و فانتزی)
  • Imdb - فیلم (سایت به زبان انگلیسی)
  • کمک کننده - فیلم
  • Advizzer - مکان ها
  • Mir4 یک سیستم آزمایشی است که قادر به کار با هر محتوا، از جمله محتوای کوتاه مدت است. در حال حاضر فقط با اخبار کار می کند.

پیوندها

یادداشت

ادبیات

  • ملویل پی، مونی آر، ناگاراجان آر.فیلتر مشارکتی تقویت‌شده محتوا برای توصیه‌های بهبودیافته // دانشگاه تگزاس، ایالات متحده آمریکا: مجموعه مقالات همایش. / AAAI-02, Austin, TX, USA, 2002. - 2002. - pp. 187-192.

بنیاد ویکی مدیا 2010.

    شاخه علمی و فعالیت های عملی، یکی از انواع کتابشناسی (رجوع کنید به کتابشناسی). هدف عمومی اصلی R. b. در اتحاد جماهیر شوروی و سایر کشورهای سوسیالیستی برای ترویج عمومی و آموزش حرفه ایو خودآموزی... دایره المعارف بزرگ شوروی

    آدرس اینترنتی: http://imhonet.ru تجاری: بدون نوع Sa ... ویکی پدیا

    این مقاله در حال حاضر توسط Member:Moshanin در حال ویرایش فعال است. لطفا تا ناپدید شدن این آگهی هیچ تغییری در آن ایجاد نکنید. در غیر این صورت، ممکن است تداخل ویرایش رخ دهد. این... ... ویکی پدیا - پیشنهاد می شود نام این صفحه به آژانس بین المللی انرژی اتمی تغییر یابد. توضیح دلایل و بحث در صفحه ویکی پدیا: برای تغییر نام / 24 جولای 2012. شاید نام فعلی آن مطابق با استانداردهای مدرن ... ویکی پدیا نباشد.

    کتابشناسی ادبیات کودکان- بخش کتابشناسی که وظایف آن شامل حسابداری و اطلاعات مربوط به آثار چاپی برای کودکان و نوجوانان است. این اطلاعات به دو صورت اصلی هدایت می شوند. آدرس ها: بزرگسالان (معلمان، والدین، مربیان، متخصصان مرتبط با... ... دایره المعارف آموزشی روسیه

    اقتصاد یک کشور- (اقتصاد ملی) اقتصاد یک کشور روابط اجتماعی است برای تامین ثروت کشور و رفاه شهروندان نقش اقتصاد ملی در حیات دولت، ماهیت، کارکردها، بخش ها و شاخص ها. اقتصاد کشور، ساختار کشورها... ... دایره المعارف سرمایه گذار

    نقدینگی- (نقدینگی) نقدینگی تحرک دارایی ها است که امکان پرداخت بی وقفه تعهدات را تضمین می کند. ویژگی های اقتصادیو نسبت نقدینگی یک بنگاه اقتصادی، بانک، بازار، دارایی ها و سرمایه گذاری ها به عنوان یک مهم اقتصادی... ... دایره المعارف سرمایه گذار

در 28 آوریل 2016، ما رسماً راه اندازی اولین دوره تطبیقی ​​را در Stepic.org اعلام کردیم که مسائل پایتون را بسته به سطح دانش آموز انتخاب می کند. قبل از این، ما همچنین دروس توصیه شده را بر روی پلتفرم اجرا کردیم تا دانش آموزان آنچه را که قبلاً تکمیل کرده بودند فراموش نکنند و موضوعات جدیدی را کشف کنند که ممکن است برای آنها جالب باشد.

در زیر برش دو موضوع اصلی وجود دارد:

  • در مورد آموزش آنلاین، جوانب مثبت / منفی / مشکلات.
  • طبقه بندی سیستم های توصیه گر، کاربرد آنها در آموزش، مثال ها.

درباره آموزش آنلاین، مزایا، معایب و مشکلات آن

این قسمت عمدتاً مقدماتی است، آموزش آنلاین، جزئیات هیجان انگیز سیستم های توصیه را در زیر تصویر زیر مشخص می کند :)

در دنیای مدرن، آموزش آنلاین به تدریج محبوبیت بیشتری پیدا می کند. فرصتی برای یادگیری از اساتید برجسته موسسات آموزشی، کشف مناطق جدید، کسب دانش مورد نیاز برای کار بدون ترک خانه، جذب می کند تعداد زیادی ازاز مردم.

یکی از رایج‌ترین شکل‌های یادگیری آنلاین، دوره‌های آنلاین باز گسترده (MOOCs، Massive Open Online Courses) است. اغلب آنها شامل فیلم ها، اسلایدها و محتوای متنی تهیه شده توسط معلم و همچنین آزمون های دانش هستند که معمولاً به طور خودکار بررسی می شوند، اما دانش آموزان می توانند کار یکدیگر را نیز بررسی کنند. طیف گسترده ای از انواع کارها را می توان به عنوان کار ارائه کرد: از انتخاب ساده پاسخ صحیح گرفته تا نوشتن یک مقاله و حتی، همانطور که در Stepik داریم، کارهای برنامه نویسی با تأیید خودکار.

آموزش آنلاین ویژگی های خاص خود را دارد که آن را از آموزش معمولی و آفلاین متمایز می کند. از جمله مزایا، اولاً، دسترسی به اینترنت برای همه کسانی است که قبلاً ذکر شد. ثانیاً، مقیاس پذیری تقریباً نامحدودی دارد: به لطف تأیید خودکار وظایف، هزاران نفر می توانند به طور همزمان در دوره تحصیل کنند که با دوره های معمولی در کلاس های درس قابل مقایسه نیست. ثالثاً، هر دانش آموز می تواند زمان و سرعت مناسبی را برای تکمیل مطالب انتخاب کند. چهارم، مربیان به انبوهی از داده ها در مورد نحوه تکمیل دوره های خود توسط کاربران دسترسی دارند که می توانند از آنها برای تجزیه و تحلیل و بهبود مطالب خود استفاده کنند.

در عین حال، معایبی نیز برای یادگیری آنلاین وجود دارد. برخلاف آموزش سنتی که دانش آموز همیشه با ارزیابی عملکرد تحصیلی خود انگیزه دارد، در مورد دوره های آنلاین هیچ جریمه ای برای مردود شدن در یک دوره وجود ندارد. به همین دلیل، سهم کسانی که دوره را تکمیل کرده اند به ندرت از 10٪ فراتر می رود (در استپیک ما، دوره آموزشی آناتولی کارپوف "مبانی آمار" بر اساس جوایز EdCrunch 2015 بهترین بود؛ رکورد 17٪ از کسانی که ثبت نام کردند اولین راه اندازی را پشت سر گذاشتند، اما این یک استثنا است). علاوه بر این معلم به دلیل کثرت دانش آموز فرصت توجه فردی به هر دانش آموز را متناسب با سطح و توان او ندارد.


ما وظیفه خود را ایجاد یک سیستم توصیه می کنیم که بتواند به دانش آموز در مورد محتوایی که برای او جالب است توصیه کند و سطح آمادگی و شکاف دانش او را در نظر بگیرد. علاوه بر این، سیستم باید بتواند پیچیدگی محتوا را ارزیابی کند. این به ویژه برای توصیه های تطبیقی ​​ضروری است که به کاربر کمک می کند مطالب را مطالعه کند، به طور انعطاف پذیر با آن سازگار شود و دقیقاً محتوایی را که اکنون برای یادگیری به آن نیاز دارد ارائه دهد. چنین سیستمی به کاربران با توصیه‌های درسی شخصی‌سازی شده که می‌تواند به آنها در یادگیری یک موضوع خاص یا ارائه چیز جدیدی کمک کند، سودمند خواهد بود.

به طور کلی، یادگیری باید حتی جالب تر می شد!

یکی از اولین نمونه های یک سیستم توصیه مدرن movielens.org است که بر اساس ترجیحات کاربران، فیلم ها را پیشنهاد می کند. این سرویس جالب است زیرا مجموعه وسیعی از داده‌ها در مورد فیلم‌ها و رتبه‌بندی‌هایی که کاربران به آن‌ها داده‌اند را در اختیار همه قرار می‌دهد. این مجموعه داده در دو دهه گذشته در تحقیقات زیادی در زمینه سیستم های توصیه گر مورد استفاده قرار گرفته است.

  • سیستم های مبتنی بر فیلتر محتوا چنین سیستم هایی به کاربران محتوایی مشابه آنچه قبلاً مطالعه کرده اند ارائه می دهند. شباهت با استفاده از ویژگی های اشیاء مورد مقایسه محاسبه می شود. برای مثال، می‌توان از ژانر وابسته یا بازیگران برای توصیه فیلم استفاده کرد. این رویکرد در سرویس رتبه بندی، جستجو و توصیه فیلم ها به پایگاه داده فیلم های اینترنتی استفاده می شود.
  • سیستم هایی با استفاده از فیلتر مشترک در این صورت محتوایی به کاربر پیشنهاد می شود که مورد علاقه کاربران مشابه است. توصیه های سرویس MovieLens دقیقا بر اساس این رویکرد است.
  • سیستم های ترکیبی ترکیبی از دو رویکرد قبلی. این نوع سیستم در نتفلیکس، سرویسی برای تماشای آنلاین فیلم و سریال استفاده می شود.

ما یک سیستم ترکیبی با استفاده فعال تر از فیلتر محتوا و استفاده کمتر فعال از فیلتر مشارکتی ایجاد کردیم.

تحقیقات زیادی در مورد سیستم های توصیه کننده برای یادگیری پیشرفته فناوری وجود دارد. خاص بودن کار در این مورد، مسیرهای جدیدی را برای توسعه سیستم توصیه گر اضافه می کند.


سیستم توصیه یک پروژه آموزشی چه ویژگی هایی دارد؟

اولاً، می توان یک سیستم توصیه تطبیقی ​​ساخت که با نیازهای کاربر در یک لحظه خاص سازگار شود و بهترین راه ها را برای مطالعه مطالب به او ارائه دهد. در این قالب، شبیه‌سازهای مختلفی را می‌توان پیاده‌سازی کرد، به عنوان مثال، در ریاضیات یا برخی از زبان‌های برنامه‌نویسی، حاوی وظایف بسیاری با پیچیدگی‌های متفاوت، که در هر زمان، موارد مختلف برای دانش‌آموزان مختلف مناسب خواهد بود.

دوم، امکان استخراج وابستگی بین مواد آموزشی از داده‌ها در مورد نحوه تکمیل آنها توسط کاربران وجود دارد.

این داده ها می توانند به استخراج موضوعات فردی در مواد، ارتباط بین این موضوعات و روابط آنها در پیچیدگی کمک کنند.

Coursera، EdX، Udacity (پلتفرم‌های یادگیری آنلاین) از سیستم‌های پیشنهادی خود برای توصیه دوره‌هایی به کاربرانی که ممکن است مورد علاقه آنها باشد، استفاده می‌کنند. نقطه ضعف این توصیه ها این است که آنها فقط می توانند کل دوره را ارائه دهند، اما بخشی از آن را نه، حتی اگر کاربر فقط به آن قسمت علاقه مند باشد. همچنین سیستمی که به این صورت ساخته شده است نمی تواند به کاربر در مطالعه درسی که انتخاب کرده کمک کند.

برعکس، سیستم توصیه منابع MathsGarden با کوچکترین قطعات محتوا - وظایف فردی - کار می کند. این یک شبیه ساز برای محاسبات ابتدایی برای دانش آموزان است دبستان، که وظایفی را به دانش آموز ارائه می دهد که در یک زمان معین از نظر پیچیدگی به طور بهینه برای او مناسب است.
برای انجام این کار، سیستم مشخصه نسبی دانش دانش آموز و همچنین ویژگی پیچیدگی وظایف را محاسبه کرده و به صورت پویا تغییر می دهد، اما در ادامه بیشتر در مورد این موضوع بیشتر می شود.

در مقالات بعدی با جزئیات بیشتری در مورد دستگاه Stepic.org و پیاده سازی سیستم توصیه گر صحبت می کنیم، سیستم توصیه گر تطبیقی ​​را تعریف می کنیم و نتایج به دست آمده را به تفصیل تجزیه و تحلیل می کنیم. جالب خواهد بود:)