Skyrim para sempre: IA generativa e criação de conteúdo para jogos

Por Marcelo de Mattos Salgado

Abstract: This text explores a little of the path of content creation — lands, dungeons, quests, items and even NPCs (non-player characters) and monsters — in digital RPG games and how technologies have advanced from simpler algorithms in the 1990s (and even before) to the generative AI up to 2023. From the example of The Elder Scrolls series with a focus on Skyrim, some questions emerge. For instance: Will we soon have a digital game capable of generating content autonomously and virtually infinitely — in addition to the initial content manually manufactured by humans and to the initial human supervision over algorithms?

Em 2011, Henry Jenkins publicou o texto Shall we play? (part one) — ou “Vamos jogar? (parte um)” — em seu blog. O artigo se baseia em uma palestra feita por Jenkins em que abordou, entre outras coisas, a importância pedagógica dos jogos digitais. O autor também lembra que Piaget, muitas décadas antes, já registrara que jogar é o “trabalho das crianças”, uma forma delicada de apresentar a rica quantidade de habilidades que os pequenos (e não tão pequenos) podem exercitar enquanto brincam e jogam.

Originalmente em 2006, no seu Cultura da convergência, Jenkins já destacara, em meio a uma análise das interações entre narrativas hipertextuais e transmidiáticas, como a então trilogia Matrix: “Numa cultura de caçadores, as crianças brincam com arco e flecha. Na sociedade da informação, elas brincam com informação” (aqui, uso a 2ª ed. da Aleph, 2009, p. 185). De fato, por meio — por exemplo — dos jogos, não apenas as crianças exercitam aptidões importantes e descobrem mais sobre si, mas a sociedade, como um todo, refina habilidades e tecnologias que serão úteis em todo tipo de empreitada — seja ou não lúdica.

É também neste sentido que o texto presente busca uma clássica série de jogos digitais de RPG (role-playing game) para analisar brevemente como a produção de conteúdo pertinente à própria estrutura dos jogos vêm se modificando nas últimas décadas. Jogos de RPG são imensamente ricos em variedade. No entanto, os mais tradicionais seguem, tipicamente, a seguinte estrutura: você cria um personagem, ou grupo de personagens, entre raças fantásticas (como anões e elfos; obrigado, Tolkien) e classes como guerreiros, bruxas etc.

Dali em diante, você enfrentará — de forma mais ou menos linear — os desafios impostos desde a narrativa central associada à história do jogo. Tais desafios incluem, muitas vezes, quebra-cabeças diversos, os quais exigem inteligência; e o combate a monstros, que demandam preparação, sabedoria e, a depender do jogo, bons reflexos. Afinal, usar uma magia de fogo contra um gigante de fogo não parece boa ideia e, em alguns jogos, pode mesmo fortalecer o inimigo. Este simples exemplo indica, inclusive, uma das lógicas pedagógicas internas comuns a jogos: a do aprendizado contínuo para aprimoramento de desempenho.

Os sistemas mais comuns de evolução do poder de personagens em RPGs envolvem cumprir tarefas (como derrotar inimigos em combate), ganhar experiência e aumentar o nível do personagem — algo bastante concreto e tangível, em um jogo. A obtenção de itens e poderes, como armas, armaduras e magias, também são um caminho para a evolução. Assim, o personagem estaria pronto para novos e mais difíceis embates, progressivamente, até o grande desafio final e a conclusão da narrativa. Note-se como isto é, ainda, uma nítida e clássica metáfora para a própria vida humana — e, não por acaso, frequentemente se inspira de algum modo na tão conhecida jornada do herói.

Era uma vez, na década de 1990

A série The Elder Scrolls (TES) começou em 1994 com o RPG TES: Arena. Hoje, seus vários jogos somam mais de 58 milhões de cópias vendidas, além de inúmeros prêmios — um enorme sucesso. O primeiro jogo, Arena (1994), já alcançara um destaque tremendo pela complexidade e abertura do mundo ao jogador. Havia uma história bastante clara a ser seguida: recuperar as partes de um cajado místico, derrotar o bruxo que tomou o lugar do imperador e salvar o mundo. No entanto, a liberdade dada ao jogador era enorme.

Em Arena, já era possível escolher se você queria seguir o caminho da narrativa central imediatamente — você provavelmente estaria muito fraco para lidar com desafios mais avançados. A outra opção, atraente para a maioria dos jogadores, consistia em muitas possibilidades, como: sair a esmo, explorando o mundo; buscar artefatos poderosos; e cumprir as mais diversas missões secundárias para, gradualmente, fortalecer seu personagem e conhecer o mundo que o cerca.

Figura 1: Arena (1994) já contava parcialmente com a criação automatizada de conteúdo, com uso de algoritmos mais simples. Crédito: Uptodown

A linha principal de TES seguiu com Daggerfall, em 1996. Até hoje, Daggerfall é considerado o mais ambicioso jogo da série em alguns aspectos, como o tamanho do mundo, com cerca de 161.000 km² (em comparação, o Reino Unido tem cerca de 209.000 km²). Como foi possível para um jogo de 1996 ter um mundo tão grande?

Em grande parte, o recurso técnico que permitiu a façanha fora o mesmo já usado em Arena (1994) — e ainda fortemente em ação hoje, como no mais recente TES: Skyrim (2010) e em jogos como Minecraft (2009). Trata-se da geração procedural (PCG, procedural content generation), método a partir do qual algoritmos devidamente programados podem, a partir dos critérios e dados disponíveis, criar dinamicamente terrenos, cidades, masmorras e missões dentro de jogos (quests), entre outros elementos. Por exemplo, uma floresta pode ser automaticamente gerada, com a alocação aleatória de árvores e riachos.

Foi fascinante encontrar um post de 2017 no Reddit em que o homem amplamente considerado como o “pai de The Elder Scrolls”, Julian Jensen, se colocou à disposição do público para esclarecer dúvidas e curiosidades. Em uma pergunta mais técnica, Jensen mencionou um colega seu, F. Kenton Musgrave, como uma autoridade em PCG que trabalhou por alguns meses no Daggerfall. Musgrave publicou um enorme livro sobre PCG com alguns colegas no auspicioso ano de 1994. No mesmo post, Jensen admite que seu “[…] conhecimento naquela época sobre vários algoritmos seria mínimo”.

O método PCG, ou de geração procedural de conteúdo, que em jogos pode ser rastreado sob formas muitos rudimentares até a década de 1980, continua muito relevante hoje. Em abril de 2023, a Epic Games, responsável pelo desenvolvimento do motor gráfico Unreal Engine 5 (UE5), demonstrou uma técnica experimental: o PCG para UE5. A diferença é, em vários níveis, o grau de sofisticação do PCG usado pelo UE5 hoje, em comparação, por exemplo, ao PCG de Daggerfall em 1996. A tecnologia é ainda experimental e, por isso, teremos que esperar para ver; mas, como a apresentação da Epic Games sugere, tudo parece muito promissor.

De volta à continuação da série principal de TES, houve Morrowind (2002), Oblivion (2006) e, finalmente, Skyrim (2011). Surpreende o tanto que Morrowind, Oblivion e mesmo Daggerfall ainda mobilizam de jogadores e criadores de mods — que são modificações feitas por jogadores e grupos de jogadores para acrescentar conteúdo e alterar aspectos estéticos de um jogo, geralmente compartilhadas gratuitamente. No entanto, é Skyrim que impressiona, mais de uma década depois de seu lançamento, por sua longa e intensa vida quase élfica (ou vampírica).

Figura 2: Skyrim (2011), especialmente se aprimorado por mods, continua muito atraente. Crédito: Wallpaper Set

Skyrim tem sido revendido pela Bethesda em ofertas que incluem os pacotes de atualizações oficiais (DLCs, ou Downloadable Contents), com a possibilidade e estímulo ao uso de mods feitos por jogadores. Deve-se apontar que o conteúdo de Skyrim é uma mistura muito exitosa de elementos construídos manualmente (de novo, terrenos, calabouços, missões etc.) por artistas e desenvolvedores humanos, somados ao uso de geração procedural, ou PCG. Aparentemente, ao menos por ora, esta soma parece a melhor opção em muitos jogos, permitindo uma fusão entre conteúdo altamente detalhado e refinado; e a vastidão inspiradora (em particular, no caso de terrenos) que apenas o PCG pode proporcionar em tempo razoável e com recursos humanos viáveis.

Entre inteligências coletivas e artificiais

Sobre as modificações feitas por jogadores, vale um adendo. Alguns desses mods são de tal qualidade — e feitos por grupos de gente tão talentosa e apaixonada — que consistem em aventuras de dezenas de horas de narrativas complexas que, por vezes, rivalizam com o produto original. As melhorias gráficas feitas por fãs sobre as texturas de itens, terrenos, casas, corpos e rostos de personagens em Skyrim, aliás, são absolutamente impressionantes; no limite, alguns criadores exploram dimensões mais sensuais que o jogo original não permite.

A rigor, enquanto houver interesse suficiente da comunidade de modders (criadores de mods) e dos jogadores, a vida de um jogo pode ser esticada indefinidamente. Assim, jogos como Skyrim e The Sims 3, largamente estendidos pela possibilidade de mods, também articulam uma manifestação muito concreta da ideia de inteligência coletiva, desenvolvida por pensadores como Pierre Lévy em livro de 1994 (A inteligência coletiva). Mas, conforme vimos aqui, há mais elementos que podem permitir longas vidas aos jogos atuais.

Vamos considerar que, à possibilidade dos mods, seja acrescida uma camada que inclua: 1) a potência gráfica do motor gráfico UE5 (ou superior); 2) a integração de tecnologias e ferramentas como ChatGPT (e afins), entre outras; 3) e a criação automatizada de conteúdo cada vez mais rico e sofisticado via PCG, especialmente com a presença de modelos de algoritmos baseados em deep learning (aprendizado profundo), caso das redes adversárias generativas (GAN), entre outras.

É importante destacar ainda, no caminho da evolução da IA generativa voltada para a criação de imagens a partir de linhas de texto, ferramentas como o Midjourney e o DALL-E — desde abril de 2022, o DALL-E 2 (por vezes, já consideradas como uma nova geração da IA generativa). Thiago Mittermayer publicou um texto neste site, em abril de 2023, em que deu atenção à IA generativa em relação ao cinema de animação. Vale apontar que o primeiro DALL-E se baseava em uma arquitetura variante de GAN; já o DALL-E 2 migrou para um modelo de difusão. Em artigo de maio de 2021, pesquisadores da OpenAI já registraram como o modelo de difusão cria imagens de melhor qualidade.

Aqui, porém, focarei as interações ainda bastante incipientes (e, em boa parte, teóricas) entre a IA generativa e a criação de conteúdo para jogos digitais; por isso, escolhi dar mais atenção às GANs, que, por serem mais conhecidas, trazem alguma firmeza a um assunto ainda muito líquido. A presença da IA generativa pode, de fato, mudar muitas coisas no que diz respeito à criação automatizada de conteúdo em um jogo digital. E começa a ficar razoável flertar com um sonho de programadores e jogadores: conteúdo virtualmente infinito e de boa qualidade criado automaticamente — qual seja, algoritmicamente, com certo grau inicial de supervisão humana.

Sobre IA generativa e jogos digitais

Uma das principais vantagens da IA generativa é sua capacidade de aprender com os dados existentes e gerar novos conteúdos com base nesse conhecimento — algo muito relevante, por exemplo, para jogos digitais; mais ainda, do tipo RPG, inclusive MMORPGs (jogos de interpretação online e maciços para múltiplos jogadores). Uma das formas de se concretizar processos de IA generativa são as já referidas redes adversárias generativas (GANs), modelo de deep learning descrito abaixo com a intenção de permitir reflexões iniciais sobre como uma IA generativa pode lidar com a criação de conteúdo em jogos digitais.

As GANs consistem em duas redes neurais concorrentes: 1) um gerador, que cria novos dados; e 2) um discriminador (separador, diferenciador) que tenta distinguir entre os dados gerados e os dados reais — a rigor, avaliando a qualidade da geração de dados produzidos via GAN. Há, portanto, uma natureza dupla na GAN, que segue iterativamente, gradualmente aprimorando tanto sua capacidade de geração quanto de discriminação de dados. Quando o gerador cria algo capaz de “enganar” o discriminador — por exemplo, algo que realmente se pareça com uma floresta de verdade —, chegou-se ao output ou saída do processo atual. Esta complexidade é possível com a GAN pelo fato desta, ao se tratar de modelo de deep learning, conseguir processar a hierarquização de dados com muito mais eficiência do que outros modelos de machine learning.

No contexto de jogos como Skyrim, isso significa que os algoritmos de IA podem analisar grandes quantidades de missões existentes, mecânicas de jogo e interações do jogador para entender os padrões e estruturas subjacentes. Ao fazer isso, os algoritmos podem gerar novas missões que se alinham de forma coerente à lógica do jogo, a arcos narrativos e elementos de construção de mundo como o de Skyrim.

Por fim, vale deixar mais evidentes as possíveis diferenças entre os potenciais de geração de conteúdo no passado e atual: o PCG de Daggerfall (1996), por exemplo, era limitado de forma muito mais estrita por regras pré-definidas pelos programadores. Ainda que fosse possível um conjunto imenso de resultados, estes ainda estavam de forma mais rígida atrelados aos dados inseridos no momento da programação e a algoritmos menos sofisticados. Já um possível cenário de PCG alinhado com IA generativa traz, em teoria, possibilidades muito mais amplas.

História sem fim

Para além de visões e previsões sobre o futuro da produção de conteúdo em jogos digitais — que certamente tem efeito sobre outras áreas midiáticas e além —, é possível cravar um último e já concreto exemplo de interações tecnológicas fascinantes envolvendo o mesmo Skyrim.

O youtuber ESO Danny, que se dedica bastante ao universo The Elder Scrolls em canal com mais de dois milhões de assinantes, fez um vídeo em maio de 2023 que requer um registro. Danny revela um cruzamento notável entre a versão em realidade virtual de Skyrim (Skyrim VR) e algumas tecnologias de IA. O criador anônimo do processo integrado, que se denomina, por ora, Art from the Machine, escreveu um script que combina três softwares de IA para, depois, aplicá-los ao Skyrim VR.

Figura 3: o youtuber ESO Danny explica como um criador anônimo conseguiu integrar tecnologias de IA ao Skyrim VR. Crédito: reprodução do canal no YouTube ESO

O processo ocorre assim: você, como jogador de Skyrim VR, pode falar diretamente com outros NPCs (personagens não jogadores) e seu seguidor — todos controlados pelo jogo. Sua fala é captada pelo software Whisper’s AI, criado pela OpenAI, que transforma fala em texto de forma bastante precisa. Então, o texto de sua fala é automaticamente passado para o ChatGPT (também da OpenAI), que, a essa altura, já foi alimentado com informações contextuais sobre o NPC com quem você está a conversar.

A rigor, o ChatGPT vai atuar (efetivamente, roleplay) como se fosse certo NPC e interagir contigo. É quando entra a terceira e última ferramenta de IA relevante aqui: o xVASynth. O xVASynth é um aplicativo de IA capaz de gerar falas de boa qualidade usando arquivos de vozes de jogos digitais, algo denominado neural speech synthesis (algo como síntese da fala neural). Como os NPCs e seguidores de Skyrim todos têm vozes e falas próprias, o aplicativo consegue partir daquela base de dados para gerar linhas de diálogos.

O resultado ainda exige pequenos intervalos entre pergunta e resposta. Além disso, o tom da voz gerada a partir dos NPCs de Skyrim ainda está ligeiramente robótico e leva a situações como um ferreiro humilde dar respostas excessivamente complexas e filosóficas. Mas, em boa parte, o resultado já é muito convincente e fica apropriado a cada NPC. Além disso, é uma expectativa muito razoável que, a exemplo de tantos avanços em IA, o progresso aqui seja igualmente veloz. Mais ainda: o NPC, assim como o ChatGPT, será capaz de recordar conversas anteriores, ou seja, seu histórico de “relacionamento” com ele, e agir de acordo.

A essa altura, dentro deste projeto, NPCs em Skyrim já são capazes de, entre outras coisas, analisar e reagir a algum item que esteja em suas mãos, dar dicas de combate e responder a perguntas tais como sobre a hora do dia naquele momento (dentro do jogo). A partir daí, imagine, por um momento, as possibilidades para as mais diversas áreas midiáticas, educacionais e de entretenimento.

Em última análise, o sucesso da IA generativa como aliada na criação de uma estrutura para conteúdo rico e virtualmente infinito em jogos como Skyrim dependerá da sofisticação dos algoritmos, da disponibilidade e qualidade dos dados de treinamento e do design e curadoria cuidadosos dos conteúdos gerados. No entanto, considerados os rápidos avanços das tecnologias de IA, não é difícil vislumbrar que a possível combinação de IA generativa e geração procedural (PCG), além do design manual de elementos do jogo e curadoria humana atenta a todos os processos, poderá oferecer níveis sem precedentes de conteúdo dinâmico.

Quem sabe, o lançamento da Bethesda em setembro de 2023, Starfield, jogo de exploração espacial com mais de mil planetas e semelhanças estruturais à série The Elder Scrolls, nos surpreenderá?

Um comentário sobre “Skyrim para sempre: IA generativa e criação de conteúdo para jogos

Deixe um comentário