GPT3 da OpenAI - Dado, Informação, Conhecimento e Competência

Atribui-se a Peter Drucker a criação do rótulo era da informação para o período em que a internet se popularizou mundialmente. O sociólogo americano Daniel Bell definiu como marco inicial desta era o ano de 1956, quando a quantidade de pessoas trabalhando em escritórios superou a quantidade de operários trabalhando nas fábricas. O período anterior que começou no século XVIII por volta do ano de 1780 é conhecido como era da revolução industrial . A mudança do sistema feudal/rural para o sistema capitalista/urbano forneceu mão de obra principalmente para a produção têxtil. Esse período inicial é chamado de primeira revolução industrial e tem como marca o surgimento do capitalista/empresário e do operário/assalariado. O período conhecido como segunda revolução industrial começa no ano de 1850 e termina depois do fim da segunda guerra mundial. O petróleo e a eletricidade substituíram o carvão e o vapor da primeira revolução industrial. A era da informação também é chamada de terceira revolução industrial ou de primeira revolução digital . Com base em avanços na AI/IA (inteligência artificial), machine learning , nanotecnologia, veículos autônomos e IoT (internet das coisas), pessoas como por exemplo o alemão Klaus Schwab , criador do European Symposium of Management (1971) em Davos e que depois se tornou Fórum Econômico Mundial (a partir de 1987) diz que estamos entrando numa nova era, tendo publicado o livro A Quarta Revolução Industrial (Editora Edipro), tema central da reunião realizada no ano de 2016 que era Como Dominar a Quarta Revolução Industrial. Outros também classificam a atual era em que estamos vivendo como era do conhecimento , uma espécie de evolução da era da informação, existem vários artigos principalmente ligados a gestão de pessoas tratando disso, mas eu não concordo com esta denominação mais recente.

Meu interesse sobre esse tema tem duas origens. A primeira porque é uma espécie de continuação do outro texto A Psicologia, o Prêmio IgNobel, o Suco de Limão e o Especialista e a segunda surgiu por causa de vídeos publicado pelo Filipe Deschamps no seu canal do YouTube sobre o GPT3 da OpenAI (organização sem fins lucrativos que tem entre seus idealizadores Elon Musk e Peter Thiel que são fundadores do PayPal ). Acredito que alguns, principalmente os que não são desenvolvedores como eu, podem ter ficado com algumas dúvidas sobre o real potencial do GPT3 . Com meus modestos recursos técnicos sobre computação eu arrisco dizer que o motor central do GPT3 é um algoritmo que entende pedidos escritos em língua inglesa (como são falados no dia a dia) e produz textos em inglês a partir destes pedidos. Assista os vídeos abaixo para entender melhor como funciona. Já existiam outros algoritmos criados com o mesmo objetivo, dentre eles o mais poderoso até então era o Turing-NLG da Microsoft . Se aprender programação é aprender algum tipo de linguagem não demorou para o GPT3 (ou alguma versão anterior) ser testada como criador de programas de computação. Os resultados realmente impressionam e o GPT3 não se contenta apenas em entregar textos escritos, consegue montar páginas de um aplicativo com textos, imagens e botões de navegação entre outros detalhes, tudo devidamente alinhado e facilmente ajustável.

Pensando neste assunto eu me lembrei de um texto do Prof. Waldemar W. Setzer do Depto. De Ciência da Computação da Universidade de São Paulo, a versão mais atualizada é de 25/5/2015, a primeira versão deste artigo foi publicada em 01/12/1999: Dado, Informação, Conhecimento e Competência. Este artigo e vários outros podem ser encontrados no site do autor hospedado no IME-USP (Instituto de Matemática e Estatística da Universidade de São Paulo - link no fim deste texto). Boa parte do texto a seguir foi escrito com base no paper acima citado com algumas reflexões pessoais, sugiro a leitura do original que é muito melhor. É importante perceber que o texto do Prof. Waldemar é ligado ao mundo da informática, assim como seu autor e a visão sobre os quatro pontos abordados (dado, informação, conhecimento e competência) partem desta perspectiva na época em que ele estava criando um departamento de competência em tecnologia da informação na Promon Engenharia. Com exceção do conceito de dado no campo da informática, os demais pontos são muito mais complexos e contraditórios inclusive entre os especialistas e sequer sonhamos em abordá-los com a profundidade que merece. Talvez desperte uma pequena curiosidade ou sirva de pontapé inicial para os dois ou três leitores que eventualmente tenham se interessado neste texto. Vale principalmente a máxima do ceticismo, duvide sempre.

DADO

Este modesto texto publicado aqui neste site, com todos os erros e vícios é um dado , que vem a ser “ uma sequência de símbolos quantificados e que podem ser reproduzidos sem que se perceba a diferença com o original” . Os programas usados nos computadores processam os dados (manipulam a estrutura) por meio de funções matemáticas. Ele permite que o texto seja formatado, que trechos sejam excluídos, que trechos sejam movidos ou comparados e a quantidade de palavras de um parágrafo ou do texto inteiro sejam contados. Outra questão importante é saber que estamos falando de dados que são armazenados e processados num computador. Isso acaba nos levando para uma questão matemática de representação formal na linguagem dos computadores, aquela história de “0” e “1” também conhecidos como bits (que vem da palavra inglesa binary digit ) e bytes (8 bits). Resumindo, as palavras deste texto são guardadas dentro de um HD de computador sob a forma de números “0” e “1” que um ou mais programas se encarregam de traduzir, guardar, organizar, vincular, ordenar, formatar etc. para que possam ser impressos ou lidos numa tela. Dado é algo essencialmente representável numericamente, ou seja, pode ser manipulado através do uso de um computador.

INFORMAÇÃO

Por outro lado, correndo risco de contrariar alguns ou muitos preconceitos (pré-conceito) e até mesmo definições que estão disponíveis na internet, informação é algo abstrato, que não pode ser processado num computador como acontece com os dados. Portanto, ao invés de definir o que é informação pode ser melhor caracterizá-lo. Não existem programas (de computador) capazes de identificar se o que eu estou escrevendo neste texto é verdadeiro, parcialmente verdadeiro ou totalmente falso/incorreto (não dizem que papel aceita tudo, até desaforo?). Para algumas pessoas a palavra Bitcoin pode ser positiva e para outras negativa. Em ambos os casos é uma informação associada individualmente a uma pessoa que gosta ou de outra pessoa que não gosta do Bitcoin. Você pode trocar o sujeito da frase por outra qualquer como uma cidade, um bar, uma loja, uma rua, uma praia, um País, uma pessoa etc. Uma alternativa que os programadores usam para melhorar / contornar essa questão é quantificar em forma de dado vinculando isso a uma escala numérica (exemplo: 5 para quem gosta muito, 4 para quem gosta, 3 para indiferente e 2 para gosta pouco e 1 para quem não gosta). Informação é algo intrínseco, interno e, portanto, algo pessoal. Existem duas formas de aquisição da informação que interagem dentro da nossa mente. A primeira é externa a partir de alguma fonte como sites, vídeos, livros, revistas, manuais, aulas e cursos, bula de remédios etc. A segunda é de natureza interna e tem a ver, por exemplo, com sentimentos como gostar ou não de alguém. Ao contrário dos dados que são (ou deveriam ser) objetivos as informações são subjetivas (dor é uma informação, mas não existe uma escala universal para medir a dor). Podemos gostar de algo num determinado momento e por causa de alguma informação nova podemos mudar o sentimento para indiferente, por exemplo. Imagens e sons são processáveis com uso de computadores, mas coisas como cheiro e medo são informações para um ser humano, mas não podem ser processados num computador. Para que um monte de dados como este texto ou sensações e/ou sentimentos (que não são dados) se transformem em informação o ser humano usa a sua capacidade de compreensão/associação mental. Independente da origem interna, externa ou combinada outro ponto importante é considerar o contexto em que a informação se constrói.

CONHECIMENTO

Até aqui tentamos distinguir de forma simples e rápida o que é dado e informação. O entendimento do que é dado é relativamente simples. Assistir um vídeo de culinária, ler um livro de receitas ou ficar olhando alguém cozinhar agrega apenas um conjunto de informações teóricas. A caracterização do conhecimento acontece quando colocamos a mão na massa e usamos estas informações transformando diversos ingredientes, nos volumes, pesos e/ou quantidades que estão escritos na receita, num bolo bem gostoso. Neste ponto o ser humano conjuga dados e informações em proporções constantes (quantidade de farinha, temperatura do forno, tamanho da forma etc.) com outras informações inconstantes como qual é o dia e hora em que o bolo deve ficar pronto e a quantidade de pessoas que serão servidas naquela ocasião (são informações que podem variar). É importante perceber que existe informação de forma isolada (no campo teórico - ler um livro de receitas) e existe informação associada ao conhecimento (na prática - preparar e assar um bolo). No estágio do conhecimento sempre haverá um processo de execução envolvendo o uso de informação. Ao contrário da informação (receita de bolo) que pode ser armazenada num computador não é possível fazer o mesmo com o conhecimento. Por causa disso entendemos que não estamos na era do conhecimento como continuação da era da informação. Não é impossível que em algum momento exista uma era do conhecimento, mas se isso vier a ocorrer ela não estará ligada ou baseada na computação, será fruto de um estágio alcançado durante o processo de evolução do ser humano usando seus processos mentais. O processo de aquisição do conhecimento em grande parte é racional, partindo da aquisição da informação, da sua vinculação com outras informações que já temos e a sua estruturação ou organização na nossa mente. Após esse processo o conhecimento é algo abstrato e pessoal que carregamos dentro da nossa mente (Como você salva um arquivo no seu PC? Clicando num ícone que geralmente tem a imagem de um disquete que parece ser a mais lógica, usa as teclas Ctrl + alguma letra ou procura a opção de salvar no menu e depois clica na palavra salvar e escolhe salvar como?). Mais do que isso o ser humano tem consciência interior desse conhecimento, ele está lá e pode ser usado a qualquer momento. É isso que nos diferencia, por exemplo, dos outros animais que podem ter conhecimento de muitas coisas conjugando informações que consegue obter através dos seus sentidos, mas não tem consciência desse conhecimento e não consegue expressá-lo de forma organizada como nós fazemos através das informações. Por enquanto um computador ainda não tem capacidade e iniciativa para relacionar um dado (fotografia), associá-lo com uma informação como ausência definitiva (morte) ou prolongada (viagem) e com um ou mais sentimentos (saudade e/ou tristeza).

COMPETÊNCIA

Por fim chegamos à competência que também está relacionado com capacidade de execução. Se conhecimento pode ser associado ao pragmatismo (no sentido de agir dentro de um contexto) a competência está relacionada com a atividade física. Competência está essencialmente ligado ao fator atividade física porque requer a sua exteriorização, ou seja, competência não é algo que se manifesta apenas na mente, ao contrário do conhecimento que pode ficar guardado na nossa mente, sem uso ou exteriorização. Competência requer exposição exterior a partir da execução de tarefas físicas como falar, escrever, programar, desenhar, projetar, montar, consertar, organizar, ensinar, construir etc. E quando entramos no terreno da execução de atividades físicas temos que considerar os três fatores que estão associados a competência: habilidade, criatividade e liberdade. Assim como os animais têm conhecimentos eles também podem ser competentes. A diferença no caso da competência humana está na capacidade que nós humanos temos de vincular objetivos ou propósitos ao que fazemos enquanto os animais simplesmente fazem o que fazem de forma automática, na maioria das vezes por puro instinto (ataca para se defender quando se sente ameaçado) ou por necessidade física (fome ou sede). Geralmente o estabelecimento de objetivos implica na busca por mais conhecimento que por sua vez vai permitir que aqueles objetivos que definimos sejam alcançados.

Existem diversas formas de medição da competência, muitos são genéricos e superficiais. Basta dar uma pesquisada no Google para encontrarmos diversos tipos de medição de competência. Quanto maior for a estrutura de uma organização (empresarial, educacional, política, esportiva, judicial etc.) mais presente estarão os tais indicadores de desempenho, que nada mais são do que medidores de competência. Esses medidores definem evolução por exemplo numa carreira ou em diferenças salariais. Quem trabalha com registro em carteira já se deparou com classificações tais como: trainee, júnior, pleno e sênior. Prestadores de serviço podem ser classificados e remunerados por exemplo como: técnico, especialista, consultor, associado etc. Essas classificações reduzem a avaliação de competências de um ser humano em algo mensurável e, portanto, reduzido ao terreno da informação que pode ser inserida num computador e acaba se tornando apenas um dado. Se essa classificação já é terrível a coisa fica ainda mais complicada quando habilidades comportamentais como liderança, trabalho em equipe e oratória passam a ser classificados com base em algum critério definido pelo RH. No campo esportivo, por exemplo, nem sempre o time com maior pontuação ou vitórias é o campeão em função da métrica usada no torneio que escolhe o campeão numa disputa entre os quatro ou oito mais bem colocados numa fase inicial jogando entre si numa outra fase. Às vezes o time com melhor pontuação acaba sendo eliminado nesta etapa seguinte ou fase mata-mata por outro que tem menor pontuação que pode até se tornar campeão do torneio. Por melhor que seja o objetivo e por mais investimentos que tenham sido feitos no processo de quantificação de aspectos subjetivos do ser humano isso continua sendo uma forma de transformar questões abstratas e subjetivas em informações quantificáveis e processáveis dentro de um computador. A existência deste tipo de métrica no mundo corporativo deve ser transparente para que todos os que estão submetidos a ela estejam cientes das regras e condições a que estão submetidos, mesmo assim conflitos e discordâncias são frequentes entre avaliador e avaliado. Eu sei bem o que é isso porque ao longo da carreira eu avaliei pessoas e também fui avaliado.

CONCLUSÃO

Computadores armazenam dados objetivos. Informações podem ter origem em dados organizados de forma objetiva ou resultar de sensações e independente da origem seu significado é pessoal e subjetivo. Conhecimento é algo essencialmente racional, mas como tem origem em informações também pode ser subjetivo. Competência é algo essencialmente individual e mensurável quando se materializa pela sua exteriorização.

Minha conclusão a partir da leitura do texto do prof. Waldemar é que as máquinas não substituirão os humanos enquanto máquinas forem máquinas, humanos forem humanos, animais forem animais e a inteligência for artificial . Para que misturar ou confundir um com outro, tudo tem seu lugar neste mundo, até as coisas que não gostamos.

Link específico do texto: https://www.ime.usp.br/~vwsetzer/dado-info.html

Link do site do Prof. Waldemar: https://www.ime.usp.br/~vwsetzer/