
(Para receber e -mails semanais de conversas com os principais CEOs e tomadores de decisão do mundo, clique em cá.)
A IBM foi um dos gigantes da computação do século XX. Ajudou a projetar o PC moderno e criou a primeira IA para derrotar um vencedor humano no jogo de xadrez.
Mas quando você pensa em IA, a IBM pode não ser a primeira, ou mesmo a décima, companhia a surgir à mente. Ele não treina grandes modelos e não torna mais os produtos voltados para o consumidor, concentrando-se em vender para outras empresas. “Somos uma empresa B2B e explicando o que fazemos ao leitor médio – levaremos toda a ajuda que podemos obter”, brincou o CEO da IBM, Arvind Krishna, antes de uma entrevista recente com o tempo.
Ainda assim, há uma história interessante de IA à espreita dentro desta instituição histórica. A IBM realmente constrói modelos de IA-não enormes uma vez que o GPT4-O do OpenAI ou os gêmeos do Google, mas os menores projetados para uso em ambientes de eminente risco, onde a precisão é de um prêmio. À medida que os negócios da IA amadurecem, isso recebe uma pergunta sátira não respondida nas mentes dos investidores de Wall Street e Silicon Valley: os ganhos econômicos da IA serão atendidos principalmente para as empresas que treinam enormes “modelos de instauração” uma vez que o OpenAI? Ou eles fluirão para as empresas-como a IBM-que podem erigir os modelos mais magros, mais baratos e precisos que são adaptados para casos de uso específicos? O horizonte da indústria poderia depender disso.
O Time conversou com Krishna no início de fevereiro, antes de uma cerimônia durante a qual recebeu um prêmio Time100 AI Impact.
Esta entrevista foi condensada e editada para transparência.
A IBM construiu o Deep Blue, o primeiro xadrez ai a vencer um vencedor humano, nos anos 90. Portanto, em 2011, o Watson da IBM foi o primeiro a lucrar o Game Show Jeopardy. Hoje, porém, a IBM não está treinando grandes sistemas de IA da mesma maneira que o OpenAI ou o Google. Você pode explicar por que a decisão foi tomada para levar um banco de trás da corrida de IA?
Quando você olha para o xadrez e o Jeopardy, a razão para enfrentar esses desafios foi a certa. Você escolhe alguma coisa que as pessoas acreditam que os computadores não podem fazer e, se você puder fazê -lo, está transmitindo o poder da tecnologia.
Cá estava o lugar onde saímos: começamos a erigir sistemas que chamarei de monolítico. Começamos a manifestar, vamos lutar um problema uma vez que o cancro. Essa acabou sendo a abordagem errada. Absolutamente vale a pena resolver, portanto não culpo o que nossas equipes fizeram naquele momento. No entanto, somos conhecidos por ser médicos? Não. Entendemos uma vez que os hospitais e protocolos funcionam? Não. Entendemos uma vez que o regulador funciona nessa espaço? Não.
Em retrospectiva, eu gostaria que tivéssemos pensado nisso somente por alguns minutos no primícias.
Portanto, dissemos: OK, você pode produzir modelos cada vez maiores e eles levarão cada vez mais computação. Portanto, a opção um, pegue um bilhão de dólares em computação e você produz um protótipo. Agora, para obter um retorno, você precisa cobrar uma certa quantia das pessoas. Mas podemos destilá-lo a um protótipo muito menor que pode não levar tanto computação e é muito, muito mais barato de percorrer, mas é um protótipo adequado para o propósito para uma tarefa em um contexto de negócios? Foi isso que levou à lente mercantil.
Mas uma das takeaways centrais dos últimos 10 anos em aprendizagem profundo parece ser que você pode tirar mais proveito dos sistemas de IA somente tentando torná -los generalistas do que você pode tentar torná -los especializados em uma única espaço. Evidente? Isso é o que é chamado de “a prelecção amarga”.
Eu poderia educadamente discordar disso. Se você estiver disposto a ter uma resposta que seja somente 90% precisa, talvez. Mas se eu gostaria de controlar um forno, ele precisa estar correto 100% do tempo. É melhor esse protótipo ter uma idéia da estudo de séries temporais assinada.
Não é uma máquina generalista que decidiu de alguma forma intuitar Moby Dick para obter sua resposta. Portanto, com saudação, não. Se você está realmente tentando chegar a lugares onde você precisa de uma precisão muito mais subida, você pode realmente se transpor muito melhor com um protótipo menor.
Na verdade, acredito que haverá alguns modelos muito grandes. Eles custam alguns bilhões de dólares para treinar, ou talvez até mais. E haverá milhares de modelos menores que são adequados. Eles vão aproveitar os grandes para o ensino, mas não realmente por seu conhecimento inerente.
Os principais benefícios econômicos da IA vão apinhar -se às maiores empresas que treinam os modelos da instauração? Ou às empresas menores que aplicam esses modelos a casos de uso específicos?
Eu acho que é exato “e”. Eu acho que a semelhança da IA é provavelmente mais próxima dos primeiros dias da Internet. Portanto, na internet, faça a si mesmo a pergunta: é útil somente para empresas muito grandes ou para empresas muito pequenas?
Pegue dois exemplos opostos. Se eu vou fabricar um negócio de streaming de vídeo, mais teor você tiver, mais pessoas você pode servir. Você obtém um efeito de rede, obtém uma economia de graduação. Por outro lado, você tem uma loja uma vez que o Etsy. De repente, a pessoa que é artesanal que faz dois itens por ano ainda pode estar presente porque o dispêndio de distribuição é extremamente insignificante.
Uma vez que sua resposta para essa pergunta influenciou a direção do seu negócio?
Nós pensamos profundamente sobre isso. Em 2020, dissemos: devemos colocar todos os nossos investimentos na tentativa de erigir um protótipo muito grande? Se for um protótipo muito grande, o dispêndio de executar esses modelos é, vamos chamá -lo, o quadrângulo do tamanho do protótipo.
Portanto, se eu tiver um protótipo de parâmetros de 10 bilhões e tenho um protótipo de 1 trilhão de parâmetros, será 10.000 vezes mais dispendioso executar o protótipo muito grande. Portanto você se vira e faz a pergunta, se for somente 1% melhor, eu realmente quero remunerar 10.000 vezes mais? E essa resposta no mundo dos negócios é quase sempre não.
Mas se puder ser 10 vezes menor, ei, vale a pena, porque isso cai mais de 90% do dispêndio de executá -lo. Foi isso que levou nossa decisão.
Vamos falar sobre computação quântica. A IBM é um grande investidor em Quantum. Qual é a sua estratégia de imagem maior lá?
Por isso, escolhemos o Quantum uma vez que uma espaço para investimentos há mais de 10 anos. Chegamos à desfecho de que é um problema de engenharia mais do que um problema científico. No momento em que é um problema de engenharia, agora você precisa fazer a pergunta a si mesmo, pode resolver os dois problemas fundamentais que estão lá?
Primeiro, as taxas de erro são realmente altas, mas os computadores normais também. O que as pessoas não reconhecem é: existem técnicas que fazem parecer livres de erros. Existem erros no fundo do nível muito fundamental, mesmo nas máquinas em que estamos, mas elas se corrigiram e, portanto, não as vemos.
Dois, porque o Quantum por sua natureza está operando em nível quântico, pequenas quantidades de pujança podem motivar a chamada perda de conformidade. Portanto eles não funcionam por muito tempo. Acreditávamos que, se pudéssemos chegar perto de um milissegundo, você pode fazer alguns cálculos realmente cuidadosos.
E portanto seguimos um caminho e achamos que fizemos muito progresso na correção de erros. Provavelmente estamos em um décimo de milissegundo, ainda não em um milissegundo, nos tempos de conformidade. Nos sentimos nos três, quatro, quatro anos seguintes – me entrego até o final da dezena – veremos alguma coisa notável intercorrer nessa frente e estou muito feliz onde está nossa equipe.
Se você pode fazer o enorme progresso que diz que espera fazer até o final da dezena, onde isso coloca a IBM uma vez que uma empresa? Isso o deixa em uma posição dominante sobre a próxima vaga de tecnologia?
Há hardware e há todas as pessoas que o exploram. Portanto, deixe -me encetar com isso: as pessoas que o explorarão serão todos os nossos clientes. Eles terão o valor, seja invenção material ou melhores baterias ou melhores fertilizantes ou melhores medicamentos, esse valor será reunido por nossos clientes.
Mas quem pode dar a eles um computador quântico em funcionamento? Eu acho que, assumindo a risca do tempo e as descobertas de que estou falando, acho que isso nos dá uma posição tremenda e a vantagem de primeira vez nesse mercado, a um ponto em que acho que nos tornaríamos a resposta de indumentária para essas tecnologias.
A tecnologia sempre foi aditiva. O smartphone não removeu o laptop. Eu acho que o Quantum será aditivo. Mas, uma vez que ajudamos a inventar mainframes no PC, talvez no Quantum ocuparemos a mesma posição por um bom tempo.