Внедрение MANGO OFFICE для М.Видео-Эльдорадо

Сергей Никитин, «Газинформсервис»: «Мы растем за счет повышения качества своих продуктов»

Оптимизация работы диспетчерской службы в жилищно-коммунальной сфере с помощью робота

От хаоса к контролю: как DLP- и DCAP-системы помогают госсектору защититься от утечек

Учиться на чужих ошибках: 7 кейсов, которые научат вас защищаться от утечек данных

Цифры говорят

Гбит/с показала InfoWatch ARMA Стена (NGFW)

19 апреля 2025

Выбрать регион

Санкт-Петербург

Поволжье

Москва

Сибирь

Урал

Юг

Дальний Восток

Северный Кавказ

Релизы

°

ЦБ

Колонка редактора

Вера Ананьева

Про возвращение иностранных ИТ-компаний в Россию. Главный вопрос — а им это надо?

Ленобласть

В Ленобласти подвели итоги цифровизации здравоохранения в первом квартале 2025 года

Великий Новгород

«Ростелеком» установил в Новгородской области 12 комплексов фиксации нарушений ПДД

Архангельск

«Ростелеком» построил первую базовую станцию в рамках проекта УЦН 2.0 в Холмогорском округе Архангельской области

Калининград

«Ростелеком» подключил к услугам связи новый спортивный комплекс в Калининградской области

Мурманск

«Росатом Инфраструктурные решения» приняли участие в форуме «Киберустойчивая Арктика 2025»

Петрозаводск

Жители Петрозаводска первыми на Северо-Западе увидели новый сериал «ВИА “Васильки”»

Вологда

Вологодская область завершила цифровизацию карт сельскохозяйственных угодий

Псков

«Ростелеком» обеспечил быстрым мобильным интернетом 6 деревень Псковской области

Сыктывкар

«Ростелеком» в Коми обеспечил скоростным мобильным интернетом Бортом и Визиндор

Ненецкий округ

«Ростелеком» обеспечил быстрым мобильным интернетом еще два населенных пункта НАО

Как сократить расходы на инференс LLM? Кейс компании «Актион»

22.08.2024 |

22 августа 2024 г. в 16.00 (мск) пройдет вебинар «Как сократить расходы на инференс LLM? Кейс компании «Актион».

Что будет на вебинаре?

Вместе с коллегами из Compressa и «Актион» обсудим способы оптимизации open-source LLM-моделей на своем сервере и преимущества использования облака для инференса LLM. Сравним производительность LLM и стоимость токенов до и после оптимизации. Разберем кейс «Актион» и Compressa по обработке 100 000+ генераций в день всего на одной GPU-карте и узнаем, как удалось сократить расходы на инференс LLM.

Кому будет полезно

ML- и MLOps-инженерам
Data Scientists и NLP-инженерам
CTO и менеджерам ML-проектов

Программа

Проблемы внешних API и open-source моделей «из коробки»
Способы оптимизации LLM-моделей на своем сервере
Сравнение производительности и стоимости токенов после оптимизации LLM
Инфраструктура Selectel для инференса LLM-моделей
Кейс «Актион» и Compressa. Оценка окупаемости решения и использование LLM в продакшене
Ответы на вопросы

Подробности ирегистрация по ссылке

Свежее по теме

MLечный путь 2025: знания, опыт, комьюнити

GPU в облаке: повышаем производительность и сокращаем стоимость инфраструктуры

GPU в облаке: повышаем производительность и сокращаем стоимость инфраструктуры

Исследование Selectel: 42% российских компаний планируют расширять свою IT-инфраструктуру в 2025 году

Исследование Selectel: 42% российских компаний планируют расширять свою IT-инфраструктуру в 2025 году

В мобильной ферме Selectel появилось тестирование приложений для iOS

В мобильной ферме Selectel появилось тестирование приложений для iOS

Интересные ссылки

Тематики: Интеграция

Ключевые слова: Selectel, Машинное обучение (ML)

Добавить новость

Добавить компанию

Новости дня
Топ-новости

ВТБ заключил договор о расширенном банковском сопровождении с ООО «Воздушные Ворота Северной Столицы» Android 16 Beta 4 доступна с 17 апреля Красная Поляна, Архыз и Домбай стали самыми популярными горнолыжными курортами России МТС Exolve представила новые возможности своей платформы для бизнес-клиентов Выручка InfoWatch за 2024 год выросла более чем на 50% до 3,9 млрд рублей ГК Softline усиливает портфель ИИ-решений и планирует приобретение платформы DreamDocs Нечеловеческий фактор: россиян будут предупреждать о разговорах с роботами У Т2 Петербург растет трафик в метрополитене Аналитика Yota: интерес петербуржцев к самиздат-площадкам вырос на 27% Android получил автоматическую перезагрузку для усиления безопасности

Все новости

Сводки о подпольных казино в Петербурге сподвигли Wink.ru снять новый сериал «Ростелеком» вошел в перечень провайдеров хостинга для государственных информационных систем Секреты сериала «ВИА “Васильки”» стали доступны жителям Петербурга В России обсудят запрет ИИ с «угрожающим уровнем риска» Selectel увеличил доходы на 29% до 13,2 млрд рублей в 2024 году МегаФон обеспечил мобильной связью алмазные месторождения в Арктике MWS выбрал МТС Exolve Петербургский метрополитен со второго раза закупает систему учета и анализа работы линий подземки «Почта России» попытается выкарабкаться из убытков В Telegram начала действовать система маркировки каналов-десятитысячников

От хаоса к контролю: как DLP- и DCAP-системы помогают госсектору защититься от утечек

Учиться на чужих ошибках: 7 кейсов, которые научат вас защищаться от утечек данных

Добавить новость

Добавить компанию

Rikor AIO 201.1/23
Оптимальное рабочее место сотрудника. Обзор моноблока Rikor AIO 201.1/23

Внедрение MANGO OFFICE для М.Видео-Эльдорадо

Оптимизация работы диспетчерской службы в жилищно-коммунальной сфере с помощью робота

Сергей Никитин, «Газинформсервис»: «Мы растем за счет повышения качества своих продуктов»

Перезагрузка карьеры: как войти в ИТ без программирования и перевернуть свою жизнь? Интервью с Анжеллой Татарской (ГК Softline)

Валерий Решетников («Рексофт Консалтинг»): «В логистике будет наблюдаться дальнейшее развитие ИТ-решений»

Михаил Воронков (ОБЛАКО.РУ): «Облачный провайдер – стратегический партнер для малого и среднего бизнеса»

Александр Борисов (RAMAX Group): «Развитие искусственного интеллекта связано с эффективностью его применения для бизнеса»

Почти 40% предпринимателей пострадают от блокировки WhatsApp в России

Почему компании разрабатывают собственные B2B-порталы? Итоги исследования

19.04.2025 Встреча SpbDotNet x Yandex № 109

20.04.2025 T-CTF 2025

21.04.2025 Митап сообщества Путь СТО

21.04.2025 Российские цифровые технологии в образовании (РЦТО — 2025)

22.04.2025 Коммерческая недвижимость 2025

22.04.2025 nanoДРАЙВ в Санкт-Петербурге

22.04.2025 Fashion-ритейл

23.04.2025 Госзаказ 2025

23.04.2025 CoworkingFest 2025

23.04.2025 Big Monitoring Meetup 12

23.04.2025 GPU в облаке: повышаем производительность и сокращаем стоимость инфраструктуры

23.04.2025 Цифровые решения для роста доходов и сокращения затрат в офисной недвижимости

23.04.2025 MLечный путь 2025: знания, опыт, комьюнити

24.04.2025 Код ИБ. Санкт-Петербург 2025

24.04.2025 Заказная мобильная разработка: плюсы и минусы на примере строительной отрасли, Super App

24.04.2025 Crash Test SPB Founders x Yandex Cloud 2025

24.04.2025 Проект года 2025

24.04.2025 System Analysis Meetup

24.04.2025 VK Go Meetup 2025

25.04.2025 SQA Days 2025

27.04.2025 SkillUp 2.0

29.04.2025 Технологии для малого бизнеса: как повысить эффективность и снизить риски

29.04.2025 Янтарный документооборот

29.04.2025 Технологии для бизнеса: как повысить эффективность и снизить риски

29.04.2025 ДронФест. Финал

29.04.2025 ИТ-конференция для финансовых директоров в Санкт-Петербурге

14.05.2025 Российский Энергетический Саммит 2025

14.05.2025 Продуктовый ритейл и общественное питание Северо-Запада

15.05.2025 Российский Нефтегазовый Саммит 2025

16.05.2025 IML 2025

16.05.2025 PiterPy 2025

20.05.2025 ExpoUAV. Подготовка кадров для индустрии беспилотных технологий

20.05.2025 Подготовка кадров для индустрии беспилотных технологий

22.05.2025 Investfunds Forum XVI — конференция институциональных инвесторов 2025

22.05.2025 Невский международный экологический конгресс 2025

22.05.2025 Малое и среднее предпринимательство 2025: импульс для развития регионов

22.05.2025 ТранспортФест 2025

23.05.2025 Analyst Days 20

23.05.2025 XX Конгресс ИТ-директоров «Белые ночи»

26.05.2025 Geometria business forum

27.05.2025 Передовые Технологии Автоматизации. ПТА – Санкт-Петербург 2025

27.05.2025 Искусство адаптации бизнеса

29.05.2025 Промышленность Ленинградской области – инвестиции, кадры, цифровизация

01.06.2025 ДП ЛИЦА. Золотой фонд

04.06.2025 ИТМ Петербург 2025

05.06.2025 DATA+AI 2025 Санкт-Петербург

05.06.2025 Промышленность в Северо-Западном регионе

05.06.2025 Информационная безопасность: в поисках уязвимостей

17.06.2025 Data Center Awards 2025. Церемония награждения

17.06.2025 ИИ — будущее сегодня 2025

18.06.2025 Чемпионат пилотов БЛА

19.06.2025 КРЭБ Балтийские ночи 2025

21.06.2025 Международный молодежный экономический форум 2025 (ПМЭФ для молодежи)

25.06.2025 Инженерное собрание России 2025

26.06.2025 Категорийный менеджмент в Белые Ночи 2025

26.06.2025 Твердые знаки 2025

02.07.2025 Neva Buyers Week 2025

02.07.2025 Финансовый конгресс Банка России 2025

03.07.2025 VIII конференция по технологиям обнаружения и противодействия БПЛА при защите гражданских объектов

05.07.2025 Летний ProIT Fest 2025

24.07.2025 Технологический суверенитет и импортозамещение в ТЭК 2025

08.08.2025 Baltic Digital Days 2025 (BDD 2025)

22.08.2025 Первый общероссийский фестиваль беспилотных технологий

06.10.2025 Форум по коммерческой эксплуатации БАС и защите гражданских объектов от атак БПЛА

15.10.2025 iAGRI 2025

06.11.2025 Баркемп, посвященный беспилотным летательным аппаратам

17.11.2025 Robotics Skills 2025

02.04.2026 ЭкспоТехноСтраж 2026

© 2004-2025 При использовании материалов ссылка на spbit.ru обязательна

О проекте Контакты Реклама Подписка

Средство массовой информации сетевое издание "SPBIT.RU" зарегистрировано Федеральной службы по надзору в сфере связи, информационных технологий и массовых коммуникаций (реестровая запись ЭЛ № ФС 77 - 84345 от 26.12.2022 г.).

Учредитель СМИ Янкевич А.В
Главный редактор Янкевич А.В
Телефон и адрес электронной почты редакции +7 (812) 7156798, info@spbit.ru

Разделы

Новости Аналитика Интервью Мероприятия Проекты IT класс Колонка редактора IT рейтинг ICT Life Тестовый стенд Фигура речи Релизы Видео Фотогалерея Инфографика

Рубрики

Интернет Мобильная связь CIO/Управление ИТ Фиксированная связь Интеграция Безопасность Веб Рынок ПК Маркетинг Торговые сети Оборудование ПО Outsourcing Кадры Регулирование Финансы Инновации Гаджеты

Регионы

Москва Санкт-Петербург Поволжье Урал Сибирь