DeepSeek: Китайският стартъп, който разтърсва пазара на изкуствен интелект
DeepSeek разтърсва индустрията за изкуствен интелект с икономически ефективни големи езикови модели, за които твърди, че могат да се представят също толкова добре, колкото и конкурентите от гиганти като OpenAI и Meta. Китайският стартъп твърди, че неговият флагмански модел за разсъждение R1 е способен да постигне "производителност, сравнима" с еквивалента o1 на OpenAI, докато новоизлезлият мултимодален модел на ИИ Janus Pro, уж може да надмине Stable Diffusion и DALL-E 3.
Конкурентът ChatGPT на DeepSeek бързо изкачи върха на App Store, а компанията разрушава финансовите пазари, като на 27 януари акциите на Nvidia се потопиха с 17%, за да намалят близо 600 млрд. долара от пазарната си капитализация, което според CNBC е най-големият еднодневен спад в историята на САЩ, загуба, която широко се приписва на DeepSeek.
Асистентът с изкуствен интелект се захранва от "най-съвременния" модел DeepSeek-V3 на стартъпа, като позволява на потребителите да задават въпроси, да планират пътувания, да генерират текст и др. Тъй като изтеглянията на приложението DeepSeek нараснаха, стартъпът започна да ограничава регистрациите поради "злонамерени атаки".
Стартирана през 2023 г. от Лианг Уенфенг (Liang Wenfeng), DeepSeek привлече вниманието към изграждането на модели на ИИ с отворен код, използвайки малко парични средства и по-малко графични процесори в сравнение с милиардите, похарчени от OpenAI, Meta, Google, Microsoft и други. Ако твърденията за производителността на DeepSeek са верни, това може да докаже, че стартъпът е успял да изгради мощни модели на ИИ въпреки строгия експортен контрол на САЩ, който не позволява на производители на чипове като Nvidia да продават високопроизводителни графични карти в Китай.
Това, което DeepSeek постигна с R1, изглежда показва, че най-добрите чипове на Nvidia може да не са необходими за постигане на напредък в областта на изкуствения интелект, което може да повлияе на съдбата на компанията в бъдеще.