TranscribeNow: یادداشت برداری زنده و زیرنویس

Summarize this content to 400 words in Persian Lang
این یک ارسال برای چالش AssemblyAI: تجارت میمون دیگر نیست.
ارسال برای درخواست صوتی بیدرنگ
چیزی که من ساختم
برای چالش AssemblyAI، یک برنامه رونویسی صوتی و یادداشت برداری در زمان واقعی ایجاد کردم. این پروژه قدرت API Streaming's AssemblyAI را با یک رابط کاربر پسند ترکیب می کند تا رونویسی فوری، یادداشت برداری زنده و تولید محتوا به کمک هوش مصنوعی را ارائه دهد.
برنامه از سه جزء اصلی تشکیل شده است:
یک برنامه افزودنی کروم برای ضبط صدای برگه، نمایش زیرنویس، و واکشی صدا از هر صفحه وب یا میکروفون
یک جزء سمت سرور برای مدیریت اتصالات WebSocket و تعامل با API AssemblyAI
یک برنامه وب ظاهری برای نمایش رونویسی ها و مدیریت یادداشت ها. کاربر قادر به بازنویسی و ایجاد یادداشت از یک جلسه ضبط شده خواهد بود
نسخه ی نمایشی
کد منبع
مخزن کد منبع
اسکرین شات ها
جلسات رونویسی شده را با متن و یادداشت های اضافی مرور و ویرایش کنید
تولید یادداشت به کمک هوش مصنوعی بر اساس محتوای رونویسی شده
رابط داشبورد که آمار رونویسی و یادداشت برداری زنده را نشان می دهد
سفر
ادغام API Lemur's AssemblyAI بخش جالبی از این پروژه بود:
یکپارچه سازی API: من اقدامات سمت سرور را برای تعامل با Lemur برای خلاصهسازی، پاسخگویی به سؤال و تولید آیتمهای اقدام اضافه کردم. این شامل یادگیری نقاط پایانی API و ساختارهای پاسخ بود.
رابط کاربری: گنجاندن ویژگیهای Lemur در بخش ظاهری نیازمند برخی ملاحظات UI/UX است تا محتوای تولید شده توسط هوش مصنوعی برای کاربران قابل دسترس و مفید باشد.
منحنی یادگیری: آشنایی با قابلیت های لمور مدتی طول کشید. من با اعلانها و پارامترهای مختلف آزمایش کردم تا بفهمم چگونه میتوان از API به بهترین شکل برای موارد استفاده خود استفاده کرد.
ارزش افزوده: Lemur به برنامه اجازه داد تا فراتر از رونویسی ساده رفته و به کاربران بینش بیشتری از محتوای صوتی خود ارائه دهد.
در حالی که ادغام Lemur چالشهای خود را داشت، در نهایت عملکرد برنامه را افزایش داد و به کاربران امکان تجزیه و تحلیل مبتنی بر هوش مصنوعی از محتوای رونویسی شدهشان را داد.
با ادغام این ابزارهای اضافی، من توانستم یک برنامه جامع تر و قدرتمندتر ایجاد کنم که فراتر از رونویسی ساده است. افزونه کروم امکان ضبط صدای یکپارچه را از هر محتوای وب فراهم می کند، در حالی که تولید محتوای با کمک هوش مصنوعی، بینش ها و خلاصه های ارزشمندی را در اختیار کاربران قرار می دهد و فرآیند یادداشت برداری آنها را کارآمدتر و مؤثرتر می کند.
در طول این پروژه، من تجربه ارزشمندی در کار با پردازش صوتی بلادرنگ، ارتباطات WebSocket و ادغام قابلیتهای هوش مصنوعی در یک برنامه وب کسب کردم. API پخش جریانی AssemblyAI ثابت کرد که قوی و قابل اعتماد است و به من امکان می دهد تجربه رونویسی پاسخگو و دقیقی را برای کاربران ایجاد کنم.
این یک ارسال برای چالش AssemblyAI: تجارت میمون دیگر نیست.
ارسال برای درخواست صوتی بیدرنگ
چیزی که من ساختم
برای چالش AssemblyAI، یک برنامه رونویسی صوتی و یادداشت برداری در زمان واقعی ایجاد کردم. این پروژه قدرت API Streaming's AssemblyAI را با یک رابط کاربر پسند ترکیب می کند تا رونویسی فوری، یادداشت برداری زنده و تولید محتوا به کمک هوش مصنوعی را ارائه دهد.
برنامه از سه جزء اصلی تشکیل شده است:
- یک برنامه افزودنی کروم برای ضبط صدای برگه، نمایش زیرنویس، و واکشی صدا از هر صفحه وب یا میکروفون
- یک جزء سمت سرور برای مدیریت اتصالات WebSocket و تعامل با API AssemblyAI
- یک برنامه وب ظاهری برای نمایش رونویسی ها و مدیریت یادداشت ها. کاربر قادر به بازنویسی و ایجاد یادداشت از یک جلسه ضبط شده خواهد بود
نسخه ی نمایشی
https://www.youtube.com/watch?v=INx_ykQ9Nhw
کد منبع
مخزن کد منبع
اسکرین شات ها
جلسات رونویسی شده را با متن و یادداشت های اضافی مرور و ویرایش کنید
تولید یادداشت به کمک هوش مصنوعی بر اساس محتوای رونویسی شده
رابط داشبورد که آمار رونویسی و یادداشت برداری زنده را نشان می دهد
سفر
ادغام API Lemur's AssemblyAI بخش جالبی از این پروژه بود:
-
یکپارچه سازی API: من اقدامات سمت سرور را برای تعامل با Lemur برای خلاصهسازی، پاسخگویی به سؤال و تولید آیتمهای اقدام اضافه کردم. این شامل یادگیری نقاط پایانی API و ساختارهای پاسخ بود.
-
رابط کاربری: گنجاندن ویژگیهای Lemur در بخش ظاهری نیازمند برخی ملاحظات UI/UX است تا محتوای تولید شده توسط هوش مصنوعی برای کاربران قابل دسترس و مفید باشد.
-
منحنی یادگیری: آشنایی با قابلیت های لمور مدتی طول کشید. من با اعلانها و پارامترهای مختلف آزمایش کردم تا بفهمم چگونه میتوان از API به بهترین شکل برای موارد استفاده خود استفاده کرد.
-
ارزش افزوده: Lemur به برنامه اجازه داد تا فراتر از رونویسی ساده رفته و به کاربران بینش بیشتری از محتوای صوتی خود ارائه دهد.
در حالی که ادغام Lemur چالشهای خود را داشت، در نهایت عملکرد برنامه را افزایش داد و به کاربران امکان تجزیه و تحلیل مبتنی بر هوش مصنوعی از محتوای رونویسی شدهشان را داد.
با ادغام این ابزارهای اضافی، من توانستم یک برنامه جامع تر و قدرتمندتر ایجاد کنم که فراتر از رونویسی ساده است. افزونه کروم امکان ضبط صدای یکپارچه را از هر محتوای وب فراهم می کند، در حالی که تولید محتوای با کمک هوش مصنوعی، بینش ها و خلاصه های ارزشمندی را در اختیار کاربران قرار می دهد و فرآیند یادداشت برداری آنها را کارآمدتر و مؤثرتر می کند.
در طول این پروژه، من تجربه ارزشمندی در کار با پردازش صوتی بلادرنگ، ارتباطات WebSocket و ادغام قابلیتهای هوش مصنوعی در یک برنامه وب کسب کردم. API پخش جریانی AssemblyAI ثابت کرد که قوی و قابل اعتماد است و به من امکان می دهد تجربه رونویسی پاسخگو و دقیقی را برای کاربران ایجاد کنم.