سنتز برنامه‌ی نوع‌محور برای APIهای RESTful

1 مقدمه

با ظهور معماری‌های نرم‌افزار-به‌عنوان-سرویس و ریزسرویس‌ها، APIهای RESTful در برنامه‌های مدرن همه‌جا حاضر شده‌اند. سرویس‌هایی مانند اسلک، استرایپ و AWS APIهای گسترده‌ای با صدها متد ارائه می‌دهند که چالش‌های قابل توجهی برای توسعه‌دهندگان در یافتن ترکیب مناسب متدها برای وظایفشان ایجاد می‌کند.

APIphany این چالش را از طریق سنتز مؤلفه‌بنیاد که به‌طور خاص برای APIهای RESTful طراحی شده است، برطرف می‌کند. این سیستم از انواع معنایی دقیق برای مشخص کردن قصد کاربر و هدایت فرآیند جستجو استفاده می‌کند و سنتز برنامه خودکار از مشخصات سطح بالا را ممکن می‌سازد.

2 پیش‌زمینه و کارهای مرتبط

2.1 سنتز مؤلفه‌بنیاد

سنتز برنامه مؤلفه‌بنیاد با موفقیت برای پیمایش APIها در زبان‌هایی مانند جاوا، اسکالا و هسکل به کار رفته است. این سنتزکننده‌ها امضاهای نوع و مثال‌های ورودی-خروجی را می‌گیرند تا قطعات برنامه‌ای که فراخوانی‌های API را با رفتار مطلوب ترکیب می‌کنند، تولید کنند.

2.2 چالش‌های APIهای RESTful

سه چالش اصلی، اعمال سنتز مؤلفه‌بنیاد بر روی APIهای RESTful را پیچیده می‌کند: (1) فقدان انواع معنایی دقیق در مشخصات API، (2) نیاز به مهندسی داده‌های نیمه‌ساختاریافته، و (3) نگرانی‌های ایمنی در اجرای فراخوانی‌های API در حین سنتز.

3 معماری APIphany

3.1 استنتاج نوع معنایی

APIphany یک الگوریتم استنتاج نوع معرفی می‌کند که مشخصات REST را با انواع معنایی تقویت می‌کند. این امر مشخص‌سازی دقیق‌تر قصد کاربر و هدایت مؤثرتر فرآیند سنتز را ممکن می‌سازد.

3.2 سنتز مهندسی داده

این سیستم شامل تکنیک‌های سنتز کارآمد برای مهندسی داده‌های نیمه‌ساختاریافته‌ای است که معمولاً هنگام کار با APIهای RESTful، از جمله اشیاء و آرایه‌های JSON، با آن‌ها مواجه می‌شویم.

3.3 اجرای شبیه‌سازی‌شده

APIphany از اجرای شبیه‌سازی‌شده برای اجتناب از اجرای فراخوانی‌های واقعی API در حین سنتز استفاده می‌کند و در عین حفظ دقت سنتز، به نگرانی‌های ایمنی و عملکرد می‌پردازد.

4 پیاده‌سازی فنی

4.1 صوری‌سازی سیستم نوع

سیستم نوع در APIphany سیستم‌های نوع استاندارد را با حاشیه‌نویسی‌های معنایی گسترش می‌دهد. قضیه نوع اصلی به صورت زیر صوری‌سازی شده است:

$\Gamma \vdash e : \tau \Rightarrow \phi$

که در آن $\Gamma$ محیط نوع، $e$ عبارت، $\tau$ نوع پایه و $\phi$ پالایش معنایی است که رفتار عبارت را ثبت می‌کند.

4.2 الگوریتم سنتز

الگوریتم سنتز از جستجوی نوع‌محور با بازگشت به عقب استفاده می‌کند. فضای جستجو با موارد زیر تعریف می‌شود:

$P := \text{apiCall}(p_1, \dots, p_n) \mid \text{map}(P, \lambda x. P) \mid \text{filter}(P, \lambda x. P) \mid \text{compose}(P, P)$

این الگوریتم نامزدهای نامعتبر را به‌طور زودهنگام با استفاده از محدودیت‌های نوع و پالایش‌های معنایی هرس می‌کند.

5 ارزیابی تجربی

5.1 روش‌شناسی

APIphany بر روی سه API دنیای واقعی (اسلک، استرایپ، گیت‌هاب) با 32 وظیفه استخراج‌شده از مخازن گیت‌هاب و StackOverflow ارزیابی شد. وظایف شامل سناریوهای یکپارچه‌سازی رایج مانند بازیابی ایمیل‌های اعضا از کانال‌های اسلک و پردازش داده‌های پرداخت از استرایپ بود.

5.2 نتایج و عملکرد

APIphany با موفقیت راه‌حل‌های صحیح را برای 29 مورد از 32 وظیفه (نرخ موفقیت 90.6٪) یافت. از بین این موارد، 23 راه‌حل در میان ده نتیجه برتر سنتز گزارش شدند که مؤثر بودن رویکرد نوع‌محور را نشان می‌دهد.

نرخ موفقیت

90.6%

29/32 وظیفه حل شد

نتایج برتر 10 تایی

79.3%

23 راه‌حل در 10 مورد برتر

میانگین زمان سنتز

4.2s

به ازای هر وظیفه

6 مثال‌های کد

مثال وظیفه سنتز برای بازیابی ایمیل‌های اعضای کانال اسلک:

// مشخصات ورودی
Type: ChannelName -> List[Email]

// راه‌حل سنتز شده
function getChannelEmails(channelName) {
  const channels = conversations_list();
  const targetChannel = channels.find(c => c.name === channelName);
  const memberIds = conversations_members(targetChannel.id);
  return memberIds.map(id => {
    const user = users_info(id);
    return user.profile.email;
  });
}

7 کاربردها و جهت‌های آینده

رویکرد APIphany را می‌توان به حوزه‌های دیگر از جمله موارد زیر گسترش داد:

سنتز API گراف‌کیوال با درون‌بینی نوع
ارکستراسیون ریزسرویس‌ها در برنامه‌های ابر-بومی
یکپارچه‌سازی دستگاه‌های اینترنت اشیاء
یکپارچه‌سازی سیستم‌های سازمانی و نوسازی APIهای قدیمی

کار آینده شامل یکپارچه‌سازی یادگیری ماشین برای استنتاج نوع بهتر و گسترش پشتیبانی از الگوهای API ناهمگام است.

8 تحلیل اصلی

APIphany نمایانگر پیشرفت قابل توجهی در سنتز برنامه برای APIهای وب است و به چالش‌های اساسی که رویکردهای قبلی را محدود کرده بود، می‌پردازد. یکپارچه‌سازی انواع معنایی با سنتز مؤلفه‌بنیاد، چارچوب قدرتمندی ایجاد می‌کند که شکاف بین روش‌های صوری و وظایف عملی یکپارچه‌سازی API را پر می‌کند.

مکانیسم استنتاج نوع در APIphany از نظر مفهومی اشتراکاتی با سیستم‌های نوع پالایش در زبان‌هایی مانند Liquid Haskell [1] دارد، اما این مفاهیم را برای دنیای پویا و نیمه‌ساختاریافته APIهای REST تطبیق می‌دهد. این تطبیق بسیار مهم است زیرا برخلاف زبان‌های دارای نوع ایستا که در آن‌ها انواع صریح هستند، APIهای REST اغلب بر روی طرح‌های JSON تکیه می‌کنند که اطلاعات نوع ساختاری اما نه معنایی ارائه می‌دهند.

تکنیک اجرای شبیه‌سازی‌شده به‌ویژه نوآورانه است، که از اجرای نمادین در تأیید برنامه [2] الهام گرفته اما آن را برای سنتز API به کار می‌برد. این رویکرد به نگرانی ایمنی حیاتی اجرای عملیات بالقوه مخرب API در حین فرآیند سنتز می‌پردازد. تکنیک‌های مشابهی در بهینه‌سازی پرس‌وجوی پایگاه داده [3] استفاده شده است، اما APIphany آن‌ها را برای حوزه پیچیده‌تر سنتز برنامه چند-API تطبیق می‌دهد.

هنگام مقایسه با سایر رویکردهای سنتز مانند FlashFill [4] برای تبدیل‌های رشته‌ای یا SyPet [5] برای سنتز مؤلفه‌بنیاد، APIphany نشان می‌دهد که چگونه دانش خاص حوزه (معناشناسی API REST) می‌تواند به طور چشمگیری اثربخشی سنتز را بهبود بخشد. نرخ موفقیت 90.6٪ در وظایف دنیای واقعی به طور قابل توجهی فراتر از چیزی است که از سنتزکننده‌های همه‌منظوره انتظار می‌رود، که فرضیه ضروری بودن سنتز آگاه از حوزه برای کاربردهای عملی را تأیید می‌کند.

مؤلفه مهندسی داده به یک چالش اساسی در یکپارچه‌سازی API می‌پردازد: عدم تطابق امپدانس بین قالب‌های داده API و نیازهای برنامه. این مشکل یادآور چالش‌های تبدیل داده در فرآیندهای ETL (استخراج، تبدیل، بارگذاری) [6] است، اما APIphany آن را از طریق سنتز به جای مشخص‌سازی دستی حل می‌کند. این رویکرد به طور بالقوه می‌تواند بر شیوه‌های طراحی API آینده تأثیر بگذارد و اطلاعات نوع سیستماتیک‌تر را در مشخصات API تشویق کند.

با نگاه به آینده، تکنیک‌های APIphany را می‌توان با مدل‌های زبانی بزرگ برای تولید کد API یکپارچه کرد. در حالی که مدل‌هایی مانند GPT-3 [7] قابلیت‌های چشمگیری برای تولید کد نشان می‌دهند، آن‌ها فاقد دقت معنایی و تضمین‌های ایمنی سنتز نوع‌محور هستند. یک رویکرد ترکیبی که تولید عصبی را با تأیید نوع‌محور ترکیب می‌کند، می‌تواند مرز بعدی در سنتز برنامه عملی را نمایندگی کند.

9 مراجع

Vazou, N., et al. "Refinement types for Haskell." ICFP 2014.
Baldoni, R., et al. "A survey of symbolic execution techniques." ACM Computing Surveys 2018.
Neumann, T. "Efficiently compiling efficient query plans for modern hardware." VLDB 2011.
Gulwani, S. "Automating string processing in spreadsheets using input-output examples." POPL 2011.
Feng, Y., et al. "Component-based synthesis for complex APIs." OOPSLA 2017.
Vassiliadis, P. "A survey of extract-transform-load technology." IJDWM 2009.
Brown, T., et al. "Language models are few-shot learners." NeurIPS 2020.
Polikarpova, N., et al. "Program synthesis from polymorphic refinement types." PLDI 2016.