Utvärdera video-codecs: Vad betyder H.264, H.265 och AV1 för dig?

Videocodec låter tekniskt, men valet av codec påverkar något så konkret som hur skarp en bild ser ut i dina videokonferenser, hur stabilt mötet flyter när nätet strular, och hur mycket du betalar för lagring eller distribution. Under åren har jag suttit på båda sidor av bordet, dels som kravställare vid upphandling av videokonferensutrustning, dels som rådgivare åt team som bygger plattformar för digitala möten. Varenda gång landar diskussionen i tre akronymer: H.264, H.265 och AV1. De är inte lika, men de överlappar på intressanta sätt, och valet är sällan svartvitt. Det handlar om kompatibilitet, kostnader, energi, bildkvalitet och strategi.

Vad gör en codec?

Codec betyder coder decoder. Den packar en videoström till något som går att skicka och lagra utan att bli orimligt stort, och packar upp det i andra änden. För att lyckas måste den gissa vad ögat inte märker, kasta redundans och beskriva rörelser mellan bildrutor med så få bitar som möjligt. Olika codecs löser det med olika verktyg: blockstorlekar, rörelsevektorer, transformtyper, prediktionslägen och entropikodning.

Det viktiga att ta med sig är att en codec alltid är en kompromiss. Högre komprimering kan spara bandbredd, men kräver mer processorkraft. Ett mer komplext verktyg ger bättre kvalitet, men kan dra mer ström på mobilen. I ett konferensrum med dedikerad hårdvara är det en sak, i en webbläsare på en äldre laptop en annan.

H.264: den trygga grundnivån

H.264, ibland kallad AVC, är arbetshästen som fortfarande bär mycket av videovärlden. Stöd finns i princip överallt: kameror, encoders i mötesrumssystem, webbläsare, GPU:er från det senaste decenniet, och nästan varje videokonferensplattform. När någon säger “det bara funkar”, är det ofta H.264 som gör jobbet.

Varför är H.264 fortfarande relevant? För att kompatibiliteten är nästan total, hårdvaruaccelerationen är bred, och latency kan hållas låg. För livekommunikation spelar just fördröjning större roll än maxad visuell kvalitet. Jag har sett stora möten med 200 deltagare flyta utan problem i H.264 trots ojämna nätverk. Bilden blir inte bäst per bit, men mötet blir begripligt, och det är målet.

Svagheterna syns när bandbredden blir snål. H.264 behöver fler bitar för att hålla detaljnivån, särskilt i komplexa scener med rörelse och textur, jämfört med modernare codecs. Vid 720p runt 1,5 till 2,5 Mbit/s klarar den sig hyggligt, men ska du ner mot 800 kbit/s börjar artefakterna bli tydliga. För asynkron video, som inspelat material, svider det i lagringskostnaderna över tid.

Licenssidan har också vägt in i besluten. H.264 har patentportföljer och royalty, men ekosystemet är väletablerat, vilket gjort det till det säkra kortet. För den som lever på videokonferenser i kommersiell skala kan licensbilden fortfarande vara ett skäl att parkera på H.264 i klientled, men server- och molnkostnader kan motivera annat på sikt.

H.265: effektivare bild, knepigare verklighet

H.265, eller HEVC, kom för att ta över. Den levererar i regel 30 till 50 procent bättre komprimering än H.264 vid samma upplevda kvalitet, därav löftet om UHD i rimliga bitrater. I mina tester och i flera publika jämförelser ligger vinsten ofta runt 35 procent i realistiska streamingprofiler, men variationen är stor. Scener med mycket rörelse, hög detalj och blandad struktur ger H.265 mer att bita i.

I videokonferenser syns vinsten när nätet pressar, eller när man försöker hålla 1080p och uppåt på lägre länkhastigheter. På bra hårdvara kan man få skarpare text, bättre hudtoner och färre block i komplexa bakgrunder. Problemet är inte tekniken utan ekosystemet. Hårdvaruacceleration finns, särskilt i nyare laptops, mobiler och konferenskameror, men inte alltid konsekvent i webbläsare eller äldre enheter. CPU-kodning i realtid i en laptopfläktar upp och ger batteritapp i ett temp som märks under ett längre möte.

Licenslandskapet har också bromsat antagandet. HEVC har flera patentpooler med separata villkor, vilket gjort att vissa plattformar för digitala möten varit försiktiga med att aktivera det brett. Resultatet blir fragmentering: vissa klienter kan, andra inte. I praktiken faller man ofta tillbaka till H.264 för att säkra kompatibilitet i större möten, vilket gör H.265 till en bonus snarare än bas.

För inspelning och VOD fungerar H.265 utmärkt när uppspelningskedjan är kontrollerad, till exempel i en internutbildningsportal där alla spelare stöder det. För live och webbläsarcentrerade arbetsflöden krävs mer eftertanke.

AV1: det öppna löftet och den oväntat snabba mognaden

AV1 kom med en annan energi. Öppen och royaltyfri, utvecklad av Alliance for Open Media, med tunga aktörer som Google, Amazon, Netflix, Microsoft och flera chip-tillverkare i ryggen. För fem år sedan var AV1 mest ett framtidslöfte i offlinekodning. Idag har den fått verklig fart: hårdvaruacceleration i nya GPU:er och system-on-chip, stöd i moderna webbläsare, och växande adoption i plattformar.

Komprimeringsvinsten är ofta 25 till 40 procent jämfört med H.265 i typiska profiler, och ibland mer när innehållet är krävande. För videokonferenser är den stora frågan inte bara kvalitet per bit, utan latenstid och energiförbrukning i realtid. Här har utvecklingen dragit iväg snabbare än jag trodde. Med hårdvaruencoder i nyare bärbara och dedikerad AV1-stöd i mötesrumssystem får man både lägre bandbredd och bättre robusthet vid paketförluster. I praktiken blir hudtoner och fin text tydligare vid samma bitrate, och i stökiga nät klarar AV1 att hålla ihop bildstrukturen bättre utan att gå i mosaik.

Samtidigt är AV1 fortfarande ojämnt spridd. På äldre enheter finns inte hårdvaruacceleration, vilket tvingar över till mjukvara. Då stiger CPU-belastningen, särskilt på encode-sidan, och batteriet lider. Flera plattformar har löst detta med dynamisk fallback: AV1 om båda sidor kan, annars H.264. Det fungerar, men du behöver planera för blandade miljöer under en övergångsperiod.

Det royaltyfria upplägget förenklar kalkylen. För en tjänst med många samtidiga strömmar och inspelningar kan AV1 minska kostnader för både utgående trafik och lagring, och slippa delar av licenspusslet. Det förklarar varför så många större aktörer driver på.

Bildkvalitet är inte bara PSNR och SSIM

Teknisk mätning behövs, men människor reagerar på andra saker. I videokonferenser vill vi känna oss förstådda. Ögon, mun, text på skärmen, skärmdelning av ett kalkylark. Just dessa element avslöjar codecens styrkor och svagheter. Jag har sett enkla A/B-tester där deltagare nästan unisont föredrar AV1 vid ca 800 till 1200 kbit/s för 720p, eftersom ansikten och text håller ihop. H.265 landar nära, men kan ge en lite hårdare kant i vissa profiler. H.264 kräver mer bitrate för samma prydlighet.

Scener med rörelse och detalj, som bläddring i en tät PDF eller en hand som vinkar framför en komplex bakgrund, pressar encoderlogiken. Bäst resultat får man när plattformen kan växla profil mellan kameraflöde och skärmdelning. En bra lösning använder olika parametrar per typ av innehåll: mindre rörelsekompensation och högre skärpa för stilla text, mer robusthet mot rörelse för video. Codecvalet spelar roll, men fintrimningen i encodern och nätverksanpassningen gör ofta lika stor skillnad.

Nätverket har sista ordet

Oavsett codec vinner den som hanterar nätverksvariationen bäst. När jitter, paketförlust och buffertar spökar märks skillnader i felresiliens. Moderna codecs har verktyg för att lokalisera skada och snabbare återhämtning, men det hjälper bara om plattformen har bra FEC, ARQ och bandbreddsadaption. I praktiken betyder det att AV1 och H.265 ofta visar fördel vid samma nominella bitrate, eftersom de kan behålla läsbarheten i ansikten längre innan bilden kollapsar. H.264, med enklare verktyg, faller snabbare in i blockighet när nätet trilskas, om inget annat kompenserar.

Jag brukar råda team att göra praktiska tester i sina faktiska nät: kontors-wifi, gästnät med congestion, mobil hotspot i pendlingstempo. Kör 30 minuter med verkliga deltagare. Logga CPU, GPU, framerate, paketförlust och upplevd kvalitet. Papperstester ljuger mindre idag än förr, men verkligheten är alltid mer spretig.

Hårdvara: den dolda avgöraren

I ett konferensrum med modern videokonferensutrustning finns ofta hårdvaruencoder och decoder som kan H.264 och H.265, ibland också AV1 i nyare generationer. På laptops är bilden mer brokig. Intel har lagt in AV1-stöd i nyare iGPUs, Nvidia och AMD i flera GPU:er från de senaste åren, och Apple har stöd i sina senare chip. Men företagsflottor roteras ofta på tre till fem år. I blandade miljöer påträffar du snabbt en handfull användare som saknar hårdvarustöd.

Mjukvaruencode i CPU kan fungera i 720p och låg framerate, men drar ström och låter fläkten gå. På en heldagsworkshop blir det besvärligt. Här lyfter H.264, eftersom nästan allt har hårdvarustöd. Mellanläget är H.265, där många enheter har decode men inte encode i hårdvara. Resultatet blir att mottagarsidan mår bra, men sändaren får jobba. Det är en anledning till att många plattformar väljer AV1 eller H.264 för uppströms, och låter servern transkoda till vad mottagaren orkar.

Licenser, kostnader och strategi

Licenser är mindre sexiga än bildkvalitet, men styr ofta vägen. H.264 och H.265 innebär licensavgifter under olika villkor. Många företag lever fint med H.264-licenser som en del av totalen, men H.265:s splittrade patentlandskap har gjort vissa beslutsfattare mer försiktiga. AV1 är royaltyfri, vilket minskar juridisk friktion och kostnad per stream, särskilt i storskalig drift.

Samtidigt är transkoding inte gratis. Om du väljer AV1 för sändning men behöver leverera H.264 till vissa klienter ökar serverkostnaden. Med GPU-accelererad transkoding i molnet blir kalkylen bättre, men du bör räkna noggrant: antal samtidiga strömmar, förväntad codec-mix, el- och kylkostnad i egna datacenter eller GPU-priser i moln. I några projekt har vi sett 20 till 35 procent lägre trafik- och lagringskostnad med AV1 i VOD-flöden, men ökad compute-kostnad i transkoding. Netto blev det positivt först när andelen klienter med AV1-decode passerade cirka 50 procent.

WebRTC och plattformar för digitala möten

WebRTC dominerar realtidsvideo i webben. H.264-stöd är i praktiken allestädes närvarande. AV1-stöd rullar ut och är aktiverat som val eller automatisk förhandling i flera större webbläsare. H.265 är knepigare i webbläsare, delvis av licensskäl, även om vissa integrerade klienter och appar använder det. Resultatet är att den som bygger egna plattformar får arbeta med kapabilitetsförhandling: annonsera stöd, mäta, och hoppa mellan codecs utan att användaren märker.

Mångas erfarenhet liknar min: bäst blir det när systemet startar i H.264 för säker anslutning och låg fördröjning, provar AV1 när hårdvarustöd upptäcks, och rullar tillbaka om CPU spikar eller batteriet sjunker för snabbt. För inspelningar och moln-inspelad komposition av möten kan AV1 ge stora besparingar om återspelning sker i moderna webbläsare.

Praktiska riktvärden för bitrate och upplösning

Siffror varierar med innehåll, encoderinställningar och nätkvalitet, men följande intervall har varit robusta i verkliga möten med normal rörelse och blandat videokonferenser innehåll:

    H.264: 720p på 1,5 till 2,5 Mbit/s ger acceptabel till bra kvalitet för ansikten och lätt skärmdelning. 1080p kräver ofta 3 till 5 Mbit/s för att hålla text läsbar utan störningar. Under 1 Mbit/s blir det snabbt grynigt, särskilt i rörelse. H.265: 720p fungerar bra kring 1 till 1,8 Mbit/s. 1080p blir användbart från 2 till 3,5 Mbit/s. Vinsterna i låg bitrate är tydliga, men kräver bra encoder och helst hårdvarustöd. AV1: 720p kan se klart ut vid 800 till 1,4 Mbit/s, 1080p vid 1,8 till 3 Mbit/s. Skärmdelning med mycket text gynnas särskilt, men kräver profil som prioriterar skärpa.

Dessa siffror ska läsas som startpunkter. Mät i din miljö, särskilt om deltagarna sitter på 4G eller trådlösa nät med varierande last.

Energi och batteri

Energieffektivitet är vardag. Ett tvåtimmarsmöte på en bärbar ska inte pressa datorn i onödan. H.264 vinner ofta på äldre enheter tack vare mogen hårdvara. AV1 kan vara lika effektiv eller bättre på nya chip med dedikerade block, men sämre på äldre där mjukvaruencode behövs. H.265 ligger i mitten men varierar kraftigt mellan plattformar. Jag brukar föreslå att klienter loggar enkla energimått under betatester: temperatur, fläkthastighet, uppskattad förbrukning. Rådata avslöjar snabbt vilka profiler som överhettar.

Säkerhet och efterlevnad

Codecvalet påverkar sällan krypteringsmodellen direkt, men i WebRTC är SRTP och DTLS standard, och vissa acceleratorer samspelar olika med olika codecs. Om ni har krav på end-to-end-kryptering och inspelning, kolla att ert valda codec-lager inte tvingar onödiga transkodningshopp i servern. Undvik att codecbrist blir en bakväg till att dekryptera i molnet för nedkonvertering, om det strider mot policyn.

Upphandling av videokonferensutrustning

När vi testat rumssystem brukar några frågor göra störst skillnad i längden. Här är en kort checklista som hjälper utan att fastna i spec-jargong:

    Stödjer kameran och codec-kortet H.264, H.265 och AV1 i hårdvara för både encode och decode, och i vilka upplösningar och framerates? Kan systemet dynamiskt byta codec under pågående samtal baserat på nät och CPU, utan att förlora anslutning? Finns tydliga administrationsinställningar för policy: tvinga H.264 i äldre miljöer, tillåta AV1 när möjligt, blockera H.265 om licens kräver? Hur ser energiförbrukningen ut vid typiska möten, och finns mätdata från leverantören? Stöd för förlusthantering: FEC, NACK, jitterbuffert, och hur samspelar dessa med respektive codec?

Den här checklistan fångar både tekniken och driften. Leverantörer som kan visa egna mätningar under olika nätförhållanden brukar vara enklare att jobba med.

Hybridmöten och blandade codecs

I verkligheten sitter någon i ett utrustat rum, någon i en webbläsare på en äldre PC, och några på mobil. Plattformen får då hantera olika codecs samtidigt. Moln-MCU:er och SFU:er transkoderar eller selektivt vidarebefordrar. Ett vanligt läge är att rumssystemet skickar H.265 ut, webbläsare tar emot H.264, och nyare klienter kör AV1 mellan sig. För att detta ska fungera smidigt behövs god överblick över CPU-budget i molnet. Här växer AV1:s fördel när fler klienter klarar det, eftersom du kan undvika extra transkodning och låta samma ström nå fler.

När vi mätt användarupplevelse i sådana hybridmöten var indikatorer som lip-sync, stabil framerate, och frånvaro av korta fryspunkter viktigare än den sista procenten i skärpa. Optimering för låg latenstid vinner oftast över maxad komprimering, särskilt i diskussioner där folk avbryter och skrattar. Annorlunda prioritering kan gälla för sändningar eller utbildningar där en presentatör pratar i 40 minuter och bildkvalitet och textskärpa står högre i kurs.

Skärmdelning och text

Skärmdelning är codecens stressprov. Små fonter och högt kontrastinnehåll kräver skarpa kanter. En del plattformar använder särskilda parameterramar för screen content coding. H.265 och AV1 har verktyg som bättre fångar sådana mönster. I billig bitrate håller de texten läsbar längre. H.264 behöver ofta växla upp bitraten för att undvika flimmer i diagonala linjer eller antialiasad text. Om ert arbete innehåller mycket kodgranskning, kalkylblad eller design i vektorverktyg, är detta en stark argumentationspunkt för AV1 eller, i kontrollerade klienter, H.265.

Hur jag väljer i praktiken

Det här är ett område där enkla tumregler faktiskt hjälper, så länge man testar dem mot verkligheten.

    Om du driver en bred videokonferenstjänst med många webbläsarklienter: aktivera H.264 som bas, lägg till AV1 med kapabilitetsförhandling. Låt klienten prova AV1 när hårdvarustöd finns och CPU är lugn, annars stanna i H.264. Om du kör dedikerade rumssystem med moderna chipset: tillåt H.265 och AV1. Mät. Se vilken som ger lägst bitrate vid önskad kvalitet och bäst energiprofil. Frys sedan policyn per modell. Om lagringskostnad driver din kalkyl för inspelningar och VOD: överväg AV1 i efterbearbetning, särskilt om de flesta tittar i moderna webbläsare. Behåll en H.264-fallbak för äldre enheter. Om ni har strikta licenskrav eller vill minimera juridisk friktion: prioritera AV1 där prestanda tillåter, håll H.264 som säker hamn. Om verksamheten är beroende av låg latenstid i alla lägen, även på äldre maskiner: H.264 förblir ett robust val, men planera för gradvis migration.

Fallgropar jag ofta ser

Överdriven tro på datablads-siffror leder till besvikelse. Två encoders med samma codec och bitrate kan ge olika resultat beroende på implementation. En annan klassiker är att slå på AV1 på alla klienter utan att beakta enheternas hårdvarustöd. På papperet ser bandbredden fin ut, men bärbara blir varma och tappas över till wifi 2,4 GHz under mötet, varpå upplevelsen försämras.

Ett annat misstag är att likställa 1080p med hög kvalitet. En 720p-ström i AV1 på 1,3 Mbit/s kan se bättre ut än en 1080p-ström i H.264 på samma bitrate. Upplösning och bitrate behöver balanseras med innehållets karaktär. För ansikten i en vanlig videokonferens ger stabil framerate och bättre komprimering oftare mer nytta än fler pixlar.

Slutligen ser jag organisationer som glömmer utbilda användarna. En enkel rekommendation om att koppla upp via ethernet i kritiska möten, stänga onödiga bakgrundsappar, och undvika kraftig bakgrundsrörelse förbättrar utväxlingen av vilken codec som helst.

Vad framtiden antyder

Chipstöd för AV1 breddas snabbt. När nästa hårdvarugeneration blir standard i företagsflottor, minskar energi- och CPU-oron. Samtidigt pressar nya verktyg i encoders både H.265 och AV1 framåt. Vi lär se finare maskininlärningsbaserade filter inne i kodningskedjan, inte bara som efterbehandling. Det kan ge ännu bättre ansiktsrendering i låg bitrate, men kräver att plattformar exponerar kontroller för att inte offra latency.

stv.se

På sikt är AV1 favorit att bli de facto-standard i webben, medan H.264 fortsätter som minsta gemensamma nämnare under lång tid. H.265 behåller styrkan i kontrollerade miljöer och i vissa industriella ekosystem där komprimeringsvinsten är avgörande och licenserna är klara.

Slutsatser som hjälper i vardagen

Codecvalet handlar om användarupplevelse, inte bara teknik. H.264 är tryggt, billigt i energi och allmänt kompatibelt. H.265 levererar bättre kvalitet per bit, men lider av licenssplittring och ojämnt stöd i webbläsare. AV1 ger ofta bäst kvalitet per bit och en attraktiv kostnadsbild i skala, förutsatt att hårdvaran hänger med och att plattformen hanterar fallbacks.

För videokonferenser i dag väljer jag hellre en smart förhandlingsstrategi än ett enda svar. Starta brett med H.264, aktivera AV1 där det flyger, utnyttja H.265 i rumssystem där det ger uppenbara vinster och licensfrågan är hanterad. Mät verklig CPU, energi och nätprestanda. Justera profiler för kameraflöden och skärmdelning separat. Då får du både skarpare möten och lägre kostnader utan att låsa in dig i ett hörn.

Och viktigast av allt, testa där användarna faktiskt sitter. Ett codec-val som glänser i labbet kan falla på ett brusigt wifi i ett hörnrum. När man väl sett skillnaden mellan en lösning som håller ihop ansikten och text i en svag länk, och en som inte gör det, blir valet mindre ideologiskt och mer praktiskt. Det är då tekniken gör jobbet den ska: att låta människor förstå varandra, utan att märka tekniken alls.