Tip:
Highlight text to annotate it
X
É interessante introduzirmos algumas terminologias básicas
que são frequentemente usadas na inteligência artificial para distinguir diferentes tipos de problemas.
O primeiro termo que irei ensiná-los é completamente versus parcialmente observável.
Um ambiente é completamente observável se aquilo que seu agente pode perceber
em qualquer ponto no tempo for completamente suficiente para tomar a melhor decisão.
Então, por exemplo, em vários jogos de cartas,
quando todas as cartas estão na mesa, a posição momentânea de todas elas
é realmente suficiente para se tomar a melhor decisão.
Isso contrasta com outros ambientes onde você precisa de memória
por parte do agente para tomar a melhor decisão possível.
Por exemplo, no jogo de poker, as cartas não estão visíveis na mesa,
e memorizar movimentos anteriores vai ajudá-lo a tomar uma decisão melhor.
Para melhor entender a diferença, considere a interação de um agente
com o ambiente por seus sensores e atuadores,
e essa interação ocorre em vários ciclos,
normalmente chamados de ciclos de percepção-ação.
Para muito ambientes, é conveniente assumir
que o ambiente possui algum tipo de estado interno.
Por exemplo, em um jogo de cartas onde as cartas não estão visíveis na mesa,
o estado pode estar relacionado às cartas em sua mão.
Um ambiente é completamente observável se os sensores podem sempre ver
todo o estado do ambiente.
Por outro lado, é parcialmente observável se eles podem ver somente uma fração do estado.
Nesse caso, memorizar dados anteriores pode nos dar informações adicionais sobre o estado
que nesse momento não é prontamente observável.
Então, por exemplo, qualquer jogo onde movimentos anteriores possam desvendar
o que pode estar na mão de uma pessoa, é considerado parcialmente observável,
e requer tratamento diferenciado.
Muito frequentemente agentes que lidam com ambientes parcialmente observáveis
precisam adquirir memória interna para entender o que
é o estado do ambiente, e iremos falar muito sobre isso
quando tratarmos dos modelos ocultos de Markov, sobre como essa estrutura
possui tal memória interna.
Uma segunda terminologia para ambientes é se o ambiente
é determinista ou estocástico.
Ambiente determinista é aquele onde as ações de seu agente
unicamente determinam a saída.
No xadrez, por exemplo, não há, de fato, nenhuma aleatoriedade quando você move uma peça.
O efeito de mover a peça é completamente pré-determinado.
Não importa para onde movermos a mesma peça, a saída é sempre a mesma.
Isso nós chamamos determinista.
Jogos com dados, por exemplo, como gamão, são estocásticos.
Enquanto você pode deterministicamente mover suas peças,
a saída de uma ação também inclui rolar um dado,
e você não pode prever os resultados.
Há uma certa quantidade de aleatoriedade envolvida na saída do dado,
e, portanto, nós chamamos isso de estocástico.
Vamos falar sobre discreto versus contínuo.
Um ambiente discreto é aquele onde você possui uma quantidade finita de escolhas de ação,
e uma quantidade finita de coisas que pode sentir.
Então, por exemplo, novamente no xadrez, há uma quantidade finita de posições no tabuleiro,
e uma quantidade finita de coisas a fazer.
Isso é diferente de uma ambiente contínuo,
onde a quantidade de ações possíveis ou coisas que você pode sentir pode ser infinita.
Então, por exemplo, se você joga dardos, há uma quantidade infinita de maneiras de mirar os dardos
e de acelerá-los.
Finalmente, distinguimos ambientes benignos versus ambientes antagonistas.
Em ambientes benignos, o ambiente pode ser aleatório.
Pode também ser estocástico, mas não possui um objetivo próprio
que contradiz seu objetivo.
O clima, por exemplo, é benigno.
Ele pode ser aleatório. Pode afetar a saída das suas ações.
Mas ele realmente não está lá para prejudicar você.
Oposto a isso, estão os ambientes antagonistas, assim como vários jogos, como xadrez,
em que seu oponente está lá para vencê-lo.
Acontece que é muito mais difícil encontrar boas ações em ambientes antagonistas,
onde um oponente te observa constantemente e contra-ataca o que você está tentando fazer.
Isso difere do ambiente benigno, em que ele pode ser meramente estocástico,
mas não está de fato interessado em complicar sua vida.
Então, vamos ver o quanto essas expressões fazem sentido pra você
ao seguirmos para nosso próximo questionário.
Aqui estão os quatro conceitos novamente: Parcialmente versus Completamente observável
Estocástico versus Determinístico, Contínuo versus Discreto,
Antagonista versus Benigno.
Deixe-me questioná-lo sobre o jogo de damas.
Marque todos os atributos que o descrevem.
Então, se você acha que o jogo de damas é parcialmente observável, marque essa aqui.
Caso contrário, não o marque;
Se você acha que ele é estocástico, marque esse,
contínuo, marque esse, antagonista, esse aqui.
Se você não conhece o jogo de damas, você pode checar na Web e pesquisar no Google,
a fim de encontrar um pouco de informação sobre o jogo.