Тъй като екологичните, социалните и управленските инициативи (ESG) стават все по-важни за компаниите, нашият клиент, една от най-добрите вериги магазини в региона на Голям Китай, търси решение за намаляване на хранителните отпадъци (в момента над 3,5 милиона щатски долара на година). Това ще им позволи не само да реализират значителни оперативни спестявания, но и да подкрепят корпоративните цели за устойчивост.
В тази публикация се фокусираме върху прогнозирането на търсенето на прясно приготвена храна от магазините за продажба на дребно. Нашите клиенти продават готови за консумация храни с кратък срок на годност – обикновено 2-3 дни. Те са изправени пред две предизвикателства: как да намалят хранителните отпадъци и как да управляват прогнозни модели за над 10 000 SKU и хиляди магазини ефективно и в мащаб.
С Amazon Forecast и поддръжката от екипа на AWS ProServe и AWS Machine Learning Solutions Lab, нашият клиент – с ограничени вътрешни специалисти по данни – вече разполага с най-съвременни възможности за прогнозиране. В рамките на няколко месеца това решение за прогнозиране им помогна да намалят отпадъците от продукти с 37%, което доведе до спестяване на разходи от 22% в 168 магазина и три категории стоки.
За да постигнат тези оперативни предимства, те внедриха редица процеси на най-добри практики, включително бърза итерация на данни и цикъл на тестване, както и паралелно тестване за намиране на оптимални комбинации от данни. Те също така създадоха канали за обработка на данни и прогнозиране, които могат да се мащабират до хиляди магазини и продуктови категории, и разработиха мащабируема референтна архитектура, която да се използва за бъдещи разширения.
ESG предизвикателството за пресни храни
В допълнение към продажбата на екологично устойчиви продукти, също така е важно индустрията за търговия на дребно да се стреми към екологични процеси, които минимизират отпадъците. Усъвършенстваното прогнозиране на инвентара с помощта на машинно обучение (ML) позволява на магазините за търговия на дребно да увеличат максимално продажбите и да минимизират отпадъците чрез по-ефективно управление на инвентара и оборота. Запасите, които не могат да бъдат продадени, са проблем за веригите магазини за смесени стоки — водят до финансови загуби и засилват отрицателните ефекти върху околната среда чрез прекомерно използване на вложена енергия и неефективни производствени процеси. И поради големите обеми, пресните хранителни продукти с кратък срок на годност могат да играят голяма роля както за финансовите резултати, така и за резултатите за устойчивост.
Освен кратък срок на годност, допълнителните предизвикателства за прогнозиране на търсенето на пресни храни включват бърз оборот, често пускане на нови продукти и големи обеми на SKU. По-конкретно:
- В сравнение с други категории, нетрайните продукти с кратък срок на годност трябва да се продават в рамките на кратък период от време, в противен случай ще изтече срокът им на годност и ще бъдат изхвърлени. Следователно точното прогнозиране е по-важно, отколкото за артикули, които могат да се съхраняват и продават за по-дълъг период от време.
- Пускането на нови продукти е често, което прави прогнозирането по-предизвикателно на ниво SKU (проблемът със студения старт).
- Голям брой елементи могат да причинят проблеми с управлението на модела за традиционните алгоритми като ARIMA, които са конфигурирани за всеки елемент. Ще трябва да се поддържат много модели, което е едновременно скъпо и трудно за мащабиране.
Прогнозиране на запасите
Amazon Forecast е напълно управлявана AI/ML услуга от AWS и включва както статистически, така и алгоритми за дълбоко обучение, които се основават на над 20 години опит в прогнозирането. С групово моделиране на ниво артикул и автоматично оптимизиране на хиперпараметъра на модела, той предоставя прогнози, които са до 40% по-точни, отколкото при използване само на традиционни методи. В допълнение, функции като преквалификация за прогнозиране могат да намалят времето и разходите за обучение с до 50%.
За да оптимизираме прогнозирането на инвентара, разгледахме основните двигатели на търсенето. Дори в категорията на пресните храни има артикули, които са по-популярни — с по-висок оборот на запасите — и артикули, които се продават по-бавно. Чрез разделянето на популярните от непопулярните елементи и обучението на предиктори, ние открихме, че предикторите могат да паснат по-добре на набора от данни и да подобрят точността на модела с различни статистически разпределения. Освен това, тъй като Forecast предоставя вероятностни прогнози въз основа на избрани от клиента квантили, ние настройваме прогнозни квантили въз основа на датите на изтичане на артикула и рентабилността на артикула.
За да приложим прогнозиране на търсенето, което подобрява устойчивостта, взехме предвид и специфични за индустрията свойства:
- Кратки срокове за изпълнение
- Честоти от висок порядък
- Продуктови алтернативи и заместители
- Психология на потребителите (често е по-вероятно потребителите да направят покупка, ако имат разнообразен набор от продукти, от които да избират)
За да балансираме разнообразието на рафтовете срещу загубата на запаси, ние не само изготвихме ежедневни прогнози за търсенето, но също така извършихме анализи какво ще стане, за да оптимизираме популяризирането на непродадени артикули преди изтичането им.
Успяхме да включим тези съображения и да отговорим на изискванията на нашите клиенти с Forecast. В следващия раздел разглеждаме по-подробно как е създадено клиентското решение.
Преглед на решението
За да се обучи предиктор, данните за обучение се поглъщат в хранилището на данни от източник на данни, като се използва един от форматите, поддържани от Forecast. Amazon Simple Storage Service (Amazon S3) е услуга за съхранение на обекти, предлагаща водеща в индустрията скалируемост, наличност на данни, сигурност и производителност. Във фазата на поглъщане ние преобразуваме данните от нашия източник във формата на набор от данни за прогноза. Прогнозата използва три типа данни: целева времева серия (TTS), която е задължителна, и свързана времева серия (RTS) и метаданни за елемент (IM), като и двете са незадължителни.
Започнахме с най-захабените SKU в магазините, които имат най-много отпадъци. За да прогнозираме ежедневното търсене на всеки магазин, първо започнахме с времеви редове (приходи, наличности, промоции) и след това прецизирахме подхода си въз основа на свойствата на магазина, като например дали е франчайз или фирмен магазин, тип магазин, наличност на тоалетна, магазин размер (малък или голям) и възраст на съхранение. Използвахме и знания от индустрията, като местни празници, промоции, време и ежедневен трафик. Нашият TTS набор от данни се състоеше от клеймо за време, идентификатор на елемент и търсене; RTS се състоеше от клеймо за време, идентификатор на артикул, отстъпка, инвентар и време; и наборът от данни за IM се състоеше от идентификатор на елемент, категория и инфраструктури на магазина. За да определим количествено значението на тези функции за нашите прогнози, използвахме обяснимост – вградена функция на прогнозата, която измерва относителното въздействие на различни атрибути върху прогнозните стойности.
Трябва да се създаде набор от данни и да се асоциира с група от набори от данни, за да се обучи предикторът. Когато създава предиктор, Forecast автоматично избира правилните алгоритми, настройва хиперпараметрите и извършва моделиране на ансамбъла. В интересна констатация от този случай използвахме кръстосани данни за COVID-19 (от 2018–2021 г.), за да обучим модела и установихме, че не е необходимо да добавяме други функции за COVID-19, като например брой ежедневни потвърдени случаи. Моделите на дълбоки невронни мрежи могат да се учат директно от ежедневните приходи.
Следващата диаграма илюстрира архитектурата на решението.
Нашият клиент поддържа своите записи на транзакции в Amazon Relational Database Service (Amazon RDS). Ние също така използваме AWS Glue за провеждане на ETL (извличане, трансформиране и зареждане), четене на данни, покриващи целевите SKU в смислен период от време, и зареждане на данни в Amazon S3 с посочен префикс. След като данните се заредят в Amazon S3, S3 събитие задейства AWS Lambda и извиква AWS Step Functions като инструмент за оркестрация.
В стъпковите функции ние подготвяме набори от данни, които включват целеви времеви редове, свързани времеви редове и метаданни за артикули. Използваме задание на AWS Glue, за да обработим данните в кофа S3. След това можем да извикаме Forecast API, за да създадем група от набори от данни и да импортираме данни от обработената кофа S3. Когато тези набори от данни са готови, можем да започнем да обучаваме предиктора.
За да обучи предиктор, ансамбълът от прогнози моделира шест различни алгоритъма и прилага оптималната комбинация от алгоритми към всеки времеви ред във вашия набор от данни. Ние използваме AutoPredictor
API, който също е достъпен през конзолата за прогнози.
След като предикторите бяха създадени, ние оценихме техните качествени показатели в таблото за управление на предсказателите. Можете да изберете името на предиктора, за да разгледате подробни резултати като претеглена квантилна загуба (wQL), претеглена абсолютна процентна грешка (WAPE), средна абсолютна мащабирана грешка (MASE), средна квадратна грешка (RMSE) и средна абсолютна процентна грешка (MAPE) ). За персонализирана оценка и анализ можете също да експортирате прогнозираните стойности, за да оцените показателите за качество на предиктора. В този случай използвахме оригиналната метрика на клиента—MAPE—за да направим паралелно сравнение с наследения модел на клиента (ARIMA) и да гарантираме, че моделът Forecast дава по-добри резултати (по-нисък MAPE). За бъдещи анализи на качеството на модела препоръчваме на клиента да използва RMSE, което по-добре отчита факта, че различните артикули имат различни обеми на продажби.
След като нашият предиктор беше готов, ние генерирахме прогнозни резултати за всеки елемент (item_id
) и измерение (store_id
), посочени в нашия набор от данни за целеви времеви редове. Местата за прогноза водят до кофа S3 с префикс S3 като дестинация.
Резултатите от прогнозата се генерират в кофата S3, задействайки функция Lambda и записвайки резултата от прогнозата в Amazon Aurora, за да може крайният потребител да прави заявки. За да предоставим резултата от прогнозата на страната на клиента, ние използваме Amazon API Gateway като входна точка и отправяме заявки към Aurora чрез функцията Lambda.
За да автоматизираме този процес, използвахме стъпкови функции и също така поддържаме бележник на Amazon SageMaker за специалисти по данни, за да представим и тестваме различни варианти на данни в набора от данни за обучение, за да намерим оптимални комбинации от данни.
Обобщение и следващи стъпки
В тази публикация показахме как да използваме Forecast за минимизиране на отпадъците чрез по-ефективно прогнозиране на запасите на хранителни продукти с кратък срок на годност. Прилагането на базирано на ML прогнозиране помогна на нашите клиенти на дребно да намалят отпадъците от продукти с 37% и разходите с 22% в 168 магазина и три категории стоки. Освен това, референтната архитектура е в състояние да поддържа мащабиране до хиляди магазини и продуктови категории. Тези усилия не само подобриха финансовите резултати, но също така демонстрираха техния ангажимент към по-устойчиви, щадящи околната среда хранителни практики. Заедно тези постижения помогнаха на нашите клиенти да напреднат към техните ESG инициативи.
Следващата стъпка за екипа е използването на възможностите за анализ на какво ще стане на Forecast за допълнително тестване на въздействието върху търсенето, добавяне на подкатегории за ежедневно прогнозиране на търсенето и мащабиране към повече магазини. В допълнение, екипът ще продължи да повтаря модела, за да продължи да намалява хранителните отпадъци и да оптимизира процесите, за да осигури по-устойчиви и екологични резултати.
За да използвате Forecast, за да подобрите прогнозирането на търсенето на дребно и да поддържате по-добри екологични резултати, можете да получите достъп до услугата чрез конзолата за управление на AWS или чрез нашето ръководство за решение, базирано на AWS CloudFormation на GitHub. За да научите повече за това как да използвате Forecast, разгледайте ресурсите на Amazon Forecast.
За авторите
Джоузи Ченг е HKT AI/ML Go-To-Market в AWS. Настоящият й фокус е върху трансформацията на бизнеса в търговията на дребно и CPG чрез данни и машинно обучение, за да стимулира огромен растеж на предприятието. Преди да се присъедини към AWS, Джоузи е работила за Amazon Retail и други китайски и американски интернет компании като продуктов мениджър за растеж.
Рей Уанг е архитект на решения в AWS. С 8 години опит в ИТ индустрията, Рей е посветен на изграждането на модерни решения в облака, особено в NoSQL, големи данни и машинно обучение. Като гладен, той премина всичките 12 сертификата на AWS, за да направи техническото си поле не само дълбоко, но и широко. Обича да чете и да гледа научнофантастични филми в свободното си време.
Шангър Лин е учен по данни и консултант в AWS, като използва машинно обучение, облачни изчисления и стратегия за данни, за да даде възможност на клиентите с цифрова трансформация и да извлече въздействие от данните.
Дан Зинрайх е старши продуктов мениджър за Amazon Forecast. Фокусът му е да помага на компаниите да вземат по-добри бизнес решения с прогнозиране, базирано на ML. Извън работата си може да бъде открит да играе хокей, да чете научна фантастика и да се гмурка.
https://aws.amazon.com/blogs/machine-learning/reduce-food-waste-to-improve-sustainability-and-financial-results-in-retail-with-amazon-forecast/