چتباتهای هوش مصنوعی (AI) به بخش جداییناپذیری از زندگی مدرن تبدیل شدهاند، اما نحوه عملکرد آنها همچنان برای بسیاری از کاربران یک راز است. چاتای ییلدیز، پژوهشگر فوقدکترا در دانشگاه توبینگن آلمان، در مقالهای که در مجله The Conversation منتشر شده، به پنج حقیقت کلیدی درباره چگونگی کارکرد این فناوری پیشرفته پرداخته است. این حقایق نهتنها به درک بهتر چتباتها کمک میکنند، بلکه محدودیتها و قابلیتهای آنها را نیز روشن میسازند. در ادامه، این پنج حقیقت را بررسی میکنیم.
۱. نقش حیاتی بازخورد انسانی در آموزش چتباتها
چتباتهای هوش مصنوعی، مانند ChatGPT، در چند مرحله آموزش میبینند. فرآیند آموزش با مرحله پیشآموزش آغاز میشود که در آن مدلها با استفاده از مجموعه دادههای متنی عظیم، توانایی پیشبینی کلمه بعدی را کسب میکنند. این مرحله به آنها درک کلی از زبان، حقایق و استدلال میدهد.
برای ایمن و مفید شدن این سیستمها، مرحلهای به نام همترازی (Alignment) انجام میشود. در این مرحله، حاشیهنویسان (افرادی که توضیحات یا یادداشتهایی به دادهها اضافه میکنند) پاسخهای مدل را بررسی و هدایت میکنند تا ایمنتر، دقیقتر و اخلاقیتر شوند. بدون این فرآیند، چتباتها ممکن است پاسخهای غیرقابلپیشبینی یا حتی مضر تولید کنند. به گفته ییلدیز، این مداخله انسانی نقش کلیدی در شکلدهی رفتار چتباتها دارد و از انتشار اطلاعات نادرست یا غیراخلاقی جلوگیری میکند.
۲. یادگیری از طریق توکنها، نه کلمات
برخلاف انسانها که زبان را از طریق کلمات میآموزند، چتباتهای هوش مصنوعی از واحدهای کوچکتری به نام توکن (Token) استفاده میکنند. توکنها میتوانند کلمات کامل، بخشهایی از کلمات یا حتی دنبالههایی از کاراکترها باشند. این فرآیند توکنسازی، اگرچه منطقی است، گاهی اوقات به تقسیمبندیهای غیرمنتظره منجر میشود که نحوه تفسیر زبان توسط چتباتها را متمایز میکند. واژگان چتباتهای مدرن معمولاً شامل ۵۰,۰۰۰ تا ۱۰۰,۰۰۰ توکن است، که به آنها امکان پردازش زبانهای پیچیده را میدهد.
۳. دانش چتباتها با زمان منسوخ میشود
چتباتهای هوش مصنوعی بهطور خودکار بهروز نمیشوند و دانش آنها به نقطه توقف دانش (Knowledge Cutoff) محدود است. برای مثال، نسخه فعلی ChatGPT تا ژوئن ۲۰۲۴ (خرداد ۱۴۰۳) بهروز شده و از رویدادهای پس از آن بیاطلاع است. برای ارائه پاسخهای بهروز، این سیستمها از موتورهای جستجو استفاده میکنند و نتایج را بر اساس قابلیت اطمینان منبع فیلتر میکنند.
بهروزرسانی دانش چتباتها فرآیندی پرهزینه و پیچیده است که همچنان یکی از چالشهای علمی حلنشده در حوزه هوش مصنوعی محسوب میشود. این محدودیت باعث میشود کاربران برای اطلاعات جدید به منابع خارجی وابسته باشند.
۴. خطر توهم در پاسخهای چتباتها
یکی از مشکلات رایج چتباتها، پدیده توهم (Hallucination) است که در آن پاسخهای نادرست یا بیمعنی با اطمینان تولید میشوند. این مشکل از ماهیت پیشبینیمحور چتباتها ناشی میشود، زیرا آنها انسجام متن را بر دقت واقعی اولویت میدهند. به گفته ییلدیز، ابزارهای بررسی حقایق (Fact-Checking) میتوانند این خطاها را کاهش دهند، اما حذف کامل آنها غیرممکن است.
برای مثال، ChatGPT ممکن است پاسخی دقیق و ظاهراً معتبر ارائه دهد که شامل ارجاعات جعلی یا اطلاعات نادرست باشد. از این رو، کاربران باید پاسخهای چتباتها را بهعنوان نقطه شروعی برای تحقیقات بیشتر در نظر بگیرند، نه منبعی قطعی.
۵. استفاده از ماشین حساب برای حل مسائل ریاضی
چتباتهای مدرن از قابلیتی به نام استدلال (Reasoning) یا زنجیره فکری (Chain of Thought) بهره میبرند که به آنها امکان میدهد مسائل پیچیده را گامبهگام حل کنند. این قابلیت بهویژه در حل معادلات ریاضی مؤثر است، جایی که چتباتها از یک ماشین حساب داخلی برای انجام محاسبات دقیق استفاده میکنند.
به عنوان مثال، ChatGPT میتواند ترتیب عملیات ریاضی (مانند اولویت ضرب بر تفریق) را درک کرده و با استفاده از ابزارهای محاسباتی، پاسخهای قابلاعتمادی ارائه دهد. این ترکیب استدلال و محاسبات، دقت چتباتها را در وظایف پیچیده افزایش داده است.
چرا این حقایق مهماند؟
درک نحوه عملکرد چتباتهای هوش مصنوعی به کاربران کمک میکند تا از این ابزارها بهطور مؤثرتری استفاده کنند و محدودیتهای آنها را بشناسند. از نقش حیاتی بازخورد انسانی گرفته تا چالشهای بهروزرسانی دانش و خطر توهم، این حقایق نشاندهنده پیچیدگیهای فناوری هوش مصنوعی و نیاز به بهبود مداوم آن هستند.
آینده چتباتهای هوش مصنوعی
با پیشرفت فناوری، انتظار میرود چتباتها با بهبود الگوریتمها و روشهای آموزشی، دقیقتر و قابلاعتمادتر شوند. با این حال، چالشهایی مانند بهروزرسانی کارآمد دانش و کاهش توهم همچنان در مرکز تحقیقات هوش مصنوعی قرار دارند.
برای اخبار بیشتر درباره پیشرفتهای هوش مصنوعی و فناوریهای نوین، با من همراه باشید.