برنامه نویسی

فیلتر متنی با ChatGPT – انجمن DEV

هنگامی که داده‌ها در Health Place وارد می‌شوند، یک سری مراحل محاسباتی و تبدیلی را طی می‌کنند و یک «خط لوله جذب» را تشکیل می‌دهند.

یکی از مراحل ضروری در خط لوله، برچسب گذاری فهرست با مفاهیمی از نمودار دانش هدف ما است.

نمایش نموداری از واژگان

شما می توانید مفاهیم را به عنوان طبقه بندی، واژگانی برای دادن معنای معنایی به داده های خود در نظر بگیرید.

مدتی است که ما هوش مصنوعی، به ویژه پردازش زبان طبیعی (NLP) را با استفاده از مدل Bag-of-Words (BoW) برای استخراج مفاهیم از متن ارائه شده در خط لوله خود پیاده سازی کرده ایم. و در بیشتر موارد، این کار فوق العاده خوبی داشته است!

هرچند کوتاه می آید.


وقتی بافت پیرامون مفهوم استخراج شده معنای دیگری به آن می دهد، مدل BoW اهمیتی نمی دهد. فقط در صورتی که مفهوم در متن وجود داشته باشد – در برخی موارد، این می تواند به یک مسئله تبدیل شود.

مثال زیر را در نظر بگیرید:

حمایت از شما یک برنامه هفت هفته ای است که جوانان را با ابزارهایی مجهز می کند تا به خودشان کمک کنند تا انعطاف پذیری و رفاه عاطفی خود را تقویت کنند.

این برنامه برای جوانانی که شرایط زیر را دارند مناسب است:

  • سن 11-17
  • شروع به نشان دادن رفتار، یا به خود نشان می دهد که آنها تحت تاثیر خلق و خوی ضعیف، استرس یا اضطراب قرار می گیرند، به طوری که شروع به تداخل با لذت از زندگی و فعالیت های عادی می کند.
  • هیچ مداخله یا حمایت فعلی از هیچ سازمان دیگری برای سلامت عاطفی یا مسائل مربوط به سلامت روان نداشته باشید
  • آنها معیارهای ارجاع CAMHS را ندارند
  • می توانند متعهد شوند که در یک برنامه 7 هفته ای حمایت از شما در منطقه محلی خود شرکت کنند

بیایید روی قطعه متن پررنگ تمرکز کنیم:

آنها معیارهای ارجاع CAMHS را ندارند

CAHMS مخفف عبارت Child and Adolescent Mental Health Services است.

در این مثال، می بینید که CAHMS در یک زمینه انحرافی ذکر شده است. این متن اشاره می کند CAHMS اما مربوط به CAHMS.

فرآیند قبلی ما نمی‌توانست این زمینه را در نظر بگیرد و بنابراین این فهرست را با “CAHMS” برچسب‌گذاری می‌کرد که منجر به یک مشکل دقت می‌شد.

نمودار دقت در مقابل یادآوری

دقت، درستی و به خاطر آوردن مانند سطل در چاه هستند. با بالا بردن یکی، دیگری را پایین می آورید.

دقت، درستی اندازه گیری می کند که چه درصدی از نتایج دقیق هستند، در حالی که به خاطر آوردن درصد از نتایج مربوطه را که واقعاً برگردانده شده اند را اندازه می گیرد.

بنابراین ما می‌توانیم مرحله NLP خود را با بهبود دقت آن تغییر دهیم، اما به قیمت کاهش فراخوان آن. اما فقط اگر راه دیگری وجود داشت.

وارد ChatGPT شوید…


لوگوی ChatGPT

ChatGPT برای درک زمینه عالی است و مورد استفاده بلافاصله برای من واضح بود.

تکنیکی که من در ذهن داشتم این بود که متن منبع را به همراه مفاهیم نمودار دانش خود که استخراج کرده بودیم به GPT منتقل کنم. سپس می‌توانیم از GPT بخواهیم به ما بگوید که کدام دسته‌بندی‌های استخراج‌شده مربوط به متن هستند و کدام‌ها نیستند.

این به ما امکان می دهد لایه NLP قبلی خود را به سمت فراخوانی بالاتر مهندسی کنیم تا تا حد امکان مفاهیم مرتبط را استخراج کنیم و در لایه بعدی، GPT مفاهیمی را که مرتبط نیستند فیلتر کنیم و دقت مورد نیاز را در اختیار ما قرار دهد.

این روند ظاهرا به ما اجازه می دهد که کیک خود را داشته باشیم و آن را بخوریم! کاری که به ندرت انجام می شود.


در تماس باشید

اگر سوالی دارید، در زیر نظر دهید، یا مرا در لینکدین پیدا کنید: linkedin.com/in/matthew-inamdar

و اگر می‌خواهید برای یک شرکت فناوری خوب مانند Health Place کار کنید، برای یک چت غیررسمی به matt@healthplace.io به من پیام دهید – ما در حال حاضر به دنبال یک مهندس Frontend هستیم!

منابع تصویر:

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا