As aplicações de mensagens instantâneas começaram a aparecer nos anos 70 em sistemas operacionais multiusuário como o UNIX, inicialmente para facilitar a comunicação com outros usuários logados na mesma máquina, depois na rede local, e posteriormente através da Internet. Alguns deles usavam um protocolo peer-to-peer (por exemplo, talk, ntalk e ytalk), enquanto outros exigiam que os colegas se conectassem a um servidor (ver talker e IRC). Como todos estes protocolos eram baseados dentro de uma janela de console, a maioria daqueles que descobriam a Internet em meados dos anos 90 e a equacionavam com a web tendiam a não encontrá-los.
Na última metade dos anos 80 e no início dos anos 90, o serviço on-line Quantum Link para computadores Commodore 64 ofereceu mensagens de usuário a usuário entre clientes atualmente conectados, as quais eles chamaram de "Mensagens On-Line" (ou OLM, para abreviar). A mais conhecida encarnação posterior da Quantum Link, America Online (AOL), oferece um produto similar sob o nome "AOL Instant Messages" (AIM). Enquanto o serviço Quantum Link funcionava em um Commodore 64, utilizando apenas o PETSCII do Commodore, a tela era visualmente dividida em seções e OLMs apareciam como uma barra amarela dizendo "Mensagem de:" e o nome do remetente junto com a mensagem no topo do que o usuário já estava fazendo, e apresentava uma lista de opções para responder. Como tal, poderia ser considerada uma espécie de GUI, embora muito mais primitiva do que os programas posteriores de GUI IM baseados em Unix, Windows e Macintosh. Os OLMs eram o que a Q-Link chamou de "Serviços Plus", o que significa que eles cobravam uma taxa extra por minuto além dos custos mensais de acesso Q-Link.
Os clientes modernos de mensagens baseadas em GUI, como são conhecidos hoje, começaram a decolar em meados dos anos 90 com o ICQ (1996) sendo o primeiro, seguido pelo AOL Instant Messenger (AOL Instant Messenger, 1997). Mais tarde, a AOL adquiriu a Mirabilis, os criadores do ICQ. Alguns anos mais tarde, o ICQ (atualmente propriedade da AOL) recebeu duas patentes de mensagens instantâneas do escritório de patentes dos EUA. Enquanto isso, outras empresas desenvolveram suas próprias aplicações (Yahoo, MSN, Excite, Ubique, IBM), cada uma com seu próprio protocolo proprietário e cliente; os usuários, portanto, tinham que executar múltiplas aplicações de clientes se desejassem usar mais de uma dessas redes.
Em 2000, foi lançado um aplicativo de código aberto e um protocolo baseado em padrões abertos chamado Jabber. Os servidores Jabber podiam atuar como gateways para outros protocolos IM, reduzindo a necessidade de executar múltiplos clientes. Clientes modernos de múltiplos protocolos como Pidgin, Trillian, Adium e Miranda podem usar qualquer um dos protocolos populares de IM sem a necessidade de um gateway de servidor.
Recentemente, muitos serviços de mensagens instantâneas começaram a oferecer recursos de videoconferência, Voz sobre IP (VoIP) e serviços de webconferência. Os serviços de webconferência integram as capacidades de videoconferência e mensagens instantâneas. Algumas empresas de mensagens instantâneas mais novas estão oferecendo compartilhamento de desktop, rádio IP e IPTV para os recursos de voz e vídeo.
O termo "instant messenger" é uma marca de serviço da Time Warner e não pode ser usado em software não afiliado à AOL nos Estados Unidos. Por esta razão, o cliente de mensagens instantâneas anteriormente conhecido como Gaim ou gaim anunciou em abril de 2007 que eles seriam renomeados como "Pidgin".