Gemini 3.5 Flash Resmi Rilis: Perbandingan dengan 3.1 Flash Lite dan 3.1 Pro Preview

Google baru saja merilis Gemini 3.5 Flash pada Mei 2026, model AI terbaru yang diklaim membawa "sustained frontier-level intelligence" dengan kecepatan tinggi dan biaya lebih rendah. Tapi bagaimana sebenarnya perbandingannya dengan model Gemini 3.1 yang sudah ada? Mari kita bedah satu per satu.

Kenalan dengan Tiga Model Gemini

Sebelum masuk ke perbandingan detail, mari kita pahami dulu positioning masing-masing model:

Gemini 3.5 Flash — The Agentic Powerhouse

Model flagship terbaru dari Google yang dirancang khusus untuk era agentic. Gemini 3.5 Flash dioptimalkan untuk deployment sub-agent, multi-step workflows, dan long-horizon tasks dalam skala besar. Cocok banget untuk rapid agentic loops yang melibatkan complex coding cycles dan iterasi.

Kapan pakai: Ketika kamu butuh AI yang bisa handle task kompleks dengan banyak step, coding agent yang sophisticated, atau workflow automation yang butuh reasoning mendalam.

Gemini 3.1 Flash Lite — The Speed Demon

Model yang fokus pada low-latency dan cost-effective untuk high-frequency, lightweight tasks. Kalau kamu butuh proses cepat dengan volume tinggi dan budget terbatas, ini pilihan yang tepat.

Kapan pakai: Translation massal, data extraction sederhana, chat bot dengan response time kritis, atau aplikasi yang butuh ribuan API calls per hari dengan budget ketat.

Gemini 3.1 Pro Preview — The Precision Expert

Model yang dioptimalkan untuk software engineering behavior dan agentic workflows yang butuh precise tool usage. Fokus pada thinking yang lebih baik, token efficiency, dan factual consistency.

Kapan pakai: Software development tasks, code review, debugging kompleks, atau workflow yang butuh multi-step execution dengan akurasi tinggi.

Perbandingan Spesifikasi Teknis

Mari kita lihat head-to-head comparison ketiga model ini:

Fitur	Gemini 3.5 Flash	Gemini 3.1 Flash Lite	Gemini 3.1 Pro Preview
Input Token Limit	1,048,576 (1M)	1,048,576 (1M)	1,048,576 (1M)
Output Token Limit	65,536 (64K)	65,536 (64K)	65,536 (64K)
Input Types	Text, Image, Video, Audio, PDF	Text, Image, Video, Audio, PDF	Text, Image, Video, Audio, PDF
Knowledge Cutoff	January 2025	January 2025	January 2025
Latest Update	May 2026	May 2026	February 2026
Status	Stable	Stable	Preview

Dari segi spesifikasi dasar, ketiganya identik dalam hal token limits dan input types. Perbedaan utama ada di capabilities dan optimization focus.

Perbandingan Capabilities

Sekarang mari kita lihat fitur-fitur yang didukung masing-masing model:

Fitur yang Didukung Semua Model ✅

Batch API — Process multiple requests sekaligus
Context Caching — Hemat biaya dengan cache context yang sering dipakai
Code Execution — Jalankan code langsung dalam model
Function Calling — Panggil external functions/APIs
Structured Outputs — Output dalam format JSON/structured
Thinking — Reasoning capability untuk problem solving
Search Grounding — Grounding dengan Google Search
Google Maps Grounding — Integrasi dengan Google Maps
URL Context — Fetch dan process content dari URL
Flex Inference — Flexible inference options
Priority Inference — Priority processing untuk urgent tasks

Perbedaan Kunci 🔍

File Search:

✅ Gemini 3.5 Flash: Supported
✅ Gemini 3.1 Flash Lite: Supported
⚠️ Gemini 3.1 Pro Preview: AI Studio only (tidak via API)

Computer Use:

❌ Semua model: Not supported

Live API:

❌ Semua model: Not supported

Audio/Image Generation:

❌ Semua model: Not supported

Perbandingan Performa dan Use Cases

Gemini 3.5 Flash — Best For:

🎯 Agentic Workflows Kompleks

Multi-agent systems dengan sub-agent deployment
Long-horizon tasks yang butuh banyak iterasi
Complex coding cycles dengan debugging otomatis
Workflow automation yang sophisticated

💡 Contoh Real-World:

# Coding agent yang bisa iterate sendiri
agent = GeminiAgent(model="gemini-3.5-flash")
result = agent.execute_task(
    "Build a REST API with authentication, 
     database integration, and comprehensive tests"
)
# Model akan breakdown task, code, test, debug, iterate

Kelebihan:

Reasoning capability paling kuat
Excellent untuk multi-step workflows
Optimal untuk agentic era
Sustained frontier-level intelligence

Kekurangan:

Kemungkinan lebih mahal dari Flash Lite
Overkill untuk simple tasks

Gemini 3.1 Flash Lite — Best For:

⚡ High-Volume, Low-Latency Tasks

Translation massal (chat messages, reviews, support tickets)
Simple data extraction dari documents
Sentiment analysis dalam skala besar
Chatbot dengan response time kritis

💡 Contoh Real-World:

# Translation service dengan volume tinggi
texts = load_customer_messages()  # 10,000 messages
translations = []

for text in texts:
    response = client.generate_content(
        model="gemini-3.1-flash-lite",
        contents=text,
        system_instruction="Translate to English, output only translation"
    )
    translations.append(response.text)

# Fast, cheap, scalable

Kelebihan:

Paling murah dari ketiga model
Latency paling rendah
Perfect untuk high-frequency tasks
Cost-effective untuk volume besar

Kekurangan:

Reasoning capability terbatas
Tidak cocok untuk complex workflows
Accuracy mungkin lebih rendah untuk nuanced tasks

Gemini 3.1 Pro Preview — Best For:

🛠️ Software Engineering & Precision Tasks

Code review dan refactoring
Debugging kompleks
Precise tool usage dalam agentic workflows
Tasks yang butuh factual consistency tinggi

💡 Contoh Real-World:

# Code review agent dengan custom tools
tools = [
    Tool(name="view_file", ...),
    Tool(name="search_code", ...),
    Tool(name="run_tests", ...)
]

# Gunakan endpoint khusus untuk custom tools
response = client.generate_content(
    model="gemini-3.1-pro-preview-customtools",
    contents="Review this PR and suggest improvements",
    tools=tools
)
# Model akan prioritize custom tools kamu

Kelebihan:

Better thinking dan reasoning
Improved token efficiency
Factually consistent output
Optimal untuk software engineering
Custom tools endpoint tersedia

Kekurangan:

Masih dalam preview (belum stable)
File Search hanya di AI Studio
Mungkin lebih lambat dari Flash Lite

Pricing Considerations

Sayangnya Google belum publish pricing detail untuk ketiga model ini di dokumentasi yang saya akses. Tapi berdasarkan positioning:

Prediksi Pricing (dari termurah ke termahal):

Gemini 3.1 Flash Lite — Paling murah, optimized untuk cost
Gemini 3.5 Flash — Mid-range, balance antara capability dan cost
Gemini 3.1 Pro Preview — Paling mahal, premium capabilities

💡 Tips Hemat Biaya:

Gunakan Context Caching untuk context yang sering dipakai (bisa hemat hingga 90%)
Pakai Batch API untuk non-urgent tasks (biasanya lebih murah)
Pilih model sesuai kebutuhan — jangan pakai Pro untuk simple translation
Gunakan Flex Inference untuk workload yang tidak time-sensitive

Kapan Pakai Model Mana?

Bingung pilih yang mana? Ini decision tree sederhana:

Pilih Gemini 3.5 Flash jika:

✅ Kamu build agentic system atau AI agents
✅ Task butuh multi-step reasoning
✅ Coding workflows dengan iterasi kompleks
✅ Long-horizon tasks yang sophisticated
✅ Budget mid-range, prioritas capability

Pilih Gemini 3.1 Flash Lite jika:

✅ Volume sangat tinggi (ribuan/jutaan requests)
✅ Latency adalah prioritas utama
✅ Task sederhana dan straightforward
✅ Budget sangat ketat
✅ Translation, extraction, classification massal

Pilih Gemini 3.1 Pro Preview jika:

✅ Software engineering tasks
✅ Butuh factual accuracy tinggi
✅ Custom tools integration penting
✅ Precision lebih penting dari speed
✅ Okay dengan preview/beta status

Migration Guide

Kalau kamu sudah pakai Gemini 3.1 Flash Lite atau Pro Preview, haruskah upgrade ke 3.5 Flash?

Dari Flash Lite → 3.5 Flash

Upgrade jika:

Task kamu makin kompleks
Butuh better reasoning
Agentic workflows mulai penting
Budget bisa naik sedikit

Stay jika:

Volume masih sangat tinggi
Task tetap simple
Cost adalah constraint utama
Current performance sudah cukup

Dari Pro Preview → 3.5 Flash

Upgrade jika:

Butuh stable release (bukan preview)
Agentic workflows lebih penting dari precision
Ingin faster iteration cycles
File Search via API penting

Stay jika:

Software engineering focus
Custom tools heavily used
Factual consistency critical
Preview status bukan masalah

Code Examples: Praktis Pakai Ketiga Model

Mari kita lihat contoh praktis menggunakan ketiga model untuk task yang berbeda:

Example 1: Translation Service (Flash Lite)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

def translate_batch(messages, target_lang="en"):
    """Fast, cheap translation untuk customer support"""
    translations = []
    
    for msg in messages:
        response = client.models.generate_content(
            model="gemini-3.1-flash-lite",
            contents=msg,
            config={
                "system_instruction": f"Translate to {target_lang}. Output only the translation.",
                "temperature": 0.1  # Low temp untuk consistency
            }
        )
        translations.append(response.text)
    
    return translations

# Process 10,000 messages dengan cost minimal
messages = load_support_tickets()
translated = translate_batch(messages)

Example 2: Coding Agent (3.5 Flash)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

def build_feature_with_agent(feature_description):
    """Agentic workflow untuk build feature lengkap"""
    
    # Step 1: Planning
    plan = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Create implementation plan for: {feature_description}",
        config={
            "thinking": True,  # Enable reasoning
            "temperature": 0.7
        }
    )
    
    # Step 2: Implementation dengan iterasi
    code = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Implement this plan:\n{plan.text}\n\nWrite complete, tested code.",
        config={
            "code_execution": True,  # Execute code untuk testing
            "thinking": True
        }
    )
    
    # Step 3: Review dan refinement
    review = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Review this code and suggest improvements:\n{code.text}",
        config={"thinking": True}
    )
    
    return {
        "plan": plan.text,
        "code": code.text,
        "review": review.text
    }

# Build feature dengan multi-step reasoning
result = build_feature_with_agent("User authentication with JWT")

Example 3: Code Review (Pro Preview)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

# Define custom tools untuk code review
tools = [
    {
        "name": "view_file",
        "description": "Read file contents",
        "parameters": {"path": "string"}
    },
    {
        "name": "search_code",
        "description": "Search codebase for patterns",
        "parameters": {"query": "string"}
    },
    {
        "name": "run_tests",
        "description": "Execute test suite",
        "parameters": {"test_path": "string"}
    }
]

def review_pull_request(pr_description, changed_files):
    """Precise code review dengan custom tools"""
    
    response = client.models.generate_content(
        model="gemini-3.1-pro-preview-customtools",  # Custom tools endpoint
        contents=f"""Review this PR:
        
Description: {pr_description}
Changed files: {changed_files}

Provide detailed review covering:
1. Code quality and best practices
2. Potential bugs or issues
3. Performance implications
4. Security concerns
5. Test coverage
""",
        config={
            "tools": tools,
            "thinking": True,
            "temperature": 0.2  # Low temp untuk precision
        }
    )
    
    return response.text

# Detailed, accurate code review
review = review_pull_request(
    pr_description="Add user authentication",
    changed_files=["auth.py", "models.py", "tests/test_auth.py"]
)

Tips Optimasi untuk Semua Model

Regardless model mana yang kamu pilih, ini best practices untuk maximize performance dan minimize cost:

1. Context Caching untuk Repeated Context

# Cache system instructions atau large context
cached_content = client.caches.create(
    model="gemini-3.5-flash",
    contents="Your large system instruction or context here...",
    ttl="3600s"  # Cache selama 1 jam
)

# Reuse cache untuk multiple requests
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="User query here",
    cached_content=cached_content.name
)
# Hemat hingga 90% cost untuk cached portion!

2. Batch API untuk Non-Urgent Tasks

# Submit batch job
batch = client.batches.create(
    model="gemini-3.1-flash-lite",
    requests=[
        {"contents": "Translate: Hello"},
        {"contents": "Translate: Goodbye"},
        # ... ribuan requests
    ]
)

# Check status nanti
status = client.batches.get(batch.name)
if status.state == "SUCCEEDED":
    results = status.results

3. Structured Outputs untuk Parsing

from pydantic import BaseModel

class CodeReview(BaseModel):
    issues: list[str]
    suggestions: list[str]
    severity: str

# Get structured output langsung
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Review this code: ...",
    config={
        "response_mime_type": "application/json",
        "response_schema": CodeReview
    }
)

review = CodeReview.parse_raw(response.text)
# No more manual parsing!

4. Temperature Tuning

# Low temperature (0.0-0.3) untuk:
# - Translation
# - Data extraction
# - Factual tasks
response = client.models.generate_content(
    model="gemini-3.1-flash-lite",
    contents="Extract email from: ...",
    config={"temperature": 0.1}
)

# Medium temperature (0.4-0.7) untuk:
# - Code generation
# - Creative tasks
# - Brainstorming
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Generate API design for ...",
    config={"temperature": 0.6}
)

# High temperature (0.8-1.0) untuk:
# - Creative writing
# - Diverse outputs
# - Exploration

Kesimpulan: Mana yang Terbaik?

Tidak ada "model terbaik" — hanya model yang paling sesuai untuk use case kamu.

TL;DR:

Gemini 3.5 Flash = Swiss Army knife untuk agentic era, balance capability dan cost
Gemini 3.1 Flash Lite = Speed demon untuk high-volume simple tasks
Gemini 3.1 Pro Preview = Precision tool untuk software engineering

Rekomendasi saya:

Start dengan 3.5 Flash untuk most use cases — ini model paling versatile
Downgrade ke Flash Lite kalau ternyata task kamu simple dan volume tinggi
Upgrade ke Pro Preview kalau butuh precision tinggi untuk software engineering

Pro tip: Jangan takut mix-and-match! Pakai Flash Lite untuk preprocessing, 3.5 Flash untuk main logic, dan Pro Preview untuk critical review. Optimize per-task, bukan per-application.

What's Next?

Google terus develop Gemini series dengan cepat. Beberapa hal yang worth di-watch:

Pricing details yang lebih jelas untuk ketiga model
Benchmark results head-to-head comparison
Live API support untuk real-time applications
Computer Use capability (masih not supported)
Gemini 3.5 Pro (kemungkinan akan rilis soon?)

Untuk update terbaru, pantau terus Google AI Developer Docs.

Sudah coba Gemini 3.5 Flash? Share pengalaman kamu di comments! Atau kalau ada pertanyaan tentang migration dari model lama, feel free to ask. 🚀

Gemini 3.5 Flash Resmi Rilis: Perbandingan dengan 3.1 Flash Lite dan 3.1 Pro Preview

Kenalan dengan Tiga Model Gemini

Sebelum masuk ke perbandingan detail, mari kita pahami dulu positioning masing-masing model:

Gemini 3.5 Flash — The Agentic Powerhouse

Kapan pakai: Ketika kamu butuh AI yang bisa handle task kompleks dengan banyak step, coding agent yang sophisticated, atau workflow automation yang butuh reasoning mendalam.

Gemini 3.1 Flash Lite — The Speed Demon

Model yang fokus pada low-latency dan cost-effective untuk high-frequency, lightweight tasks. Kalau kamu butuh proses cepat dengan volume tinggi dan budget terbatas, ini pilihan yang tepat.

Kapan pakai: Translation massal, data extraction sederhana, chat bot dengan response time kritis, atau aplikasi yang butuh ribuan API calls per hari dengan budget ketat.

Gemini 3.1 Pro Preview — The Precision Expert

Model yang dioptimalkan untuk software engineering behavior dan agentic workflows yang butuh precise tool usage. Fokus pada thinking yang lebih baik, token efficiency, dan factual consistency.

Kapan pakai: Software development tasks, code review, debugging kompleks, atau workflow yang butuh multi-step execution dengan akurasi tinggi.

Perbandingan Spesifikasi Teknis

Mari kita lihat head-to-head comparison ketiga model ini:

Fitur	Gemini 3.5 Flash	Gemini 3.1 Flash Lite	Gemini 3.1 Pro Preview
Input Token Limit	1,048,576 (1M)	1,048,576 (1M)	1,048,576 (1M)
Output Token Limit	65,536 (64K)	65,536 (64K)	65,536 (64K)
Input Types	Text, Image, Video, Audio, PDF	Text, Image, Video, Audio, PDF	Text, Image, Video, Audio, PDF
Knowledge Cutoff	January 2025	January 2025	January 2025
Latest Update	May 2026	May 2026	February 2026
Status	Stable	Stable	Preview

Dari segi spesifikasi dasar, ketiganya identik dalam hal token limits dan input types. Perbedaan utama ada di capabilities dan optimization focus.

Perbandingan Capabilities

Sekarang mari kita lihat fitur-fitur yang didukung masing-masing model:

Fitur yang Didukung Semua Model ✅

Batch API — Process multiple requests sekaligus
Context Caching — Hemat biaya dengan cache context yang sering dipakai
Code Execution — Jalankan code langsung dalam model
Function Calling — Panggil external functions/APIs
Structured Outputs — Output dalam format JSON/structured
Thinking — Reasoning capability untuk problem solving
Search Grounding — Grounding dengan Google Search
Google Maps Grounding — Integrasi dengan Google Maps
URL Context — Fetch dan process content dari URL
Flex Inference — Flexible inference options
Priority Inference — Priority processing untuk urgent tasks

Perbedaan Kunci 🔍

File Search:

✅ Gemini 3.5 Flash: Supported
✅ Gemini 3.1 Flash Lite: Supported
⚠️ Gemini 3.1 Pro Preview: AI Studio only (tidak via API)

Computer Use:

❌ Semua model: Not supported

Live API:

❌ Semua model: Not supported

Audio/Image Generation:

❌ Semua model: Not supported

Perbandingan Performa dan Use Cases

Gemini 3.5 Flash — Best For:

🎯 Agentic Workflows Kompleks

Multi-agent systems dengan sub-agent deployment
Long-horizon tasks yang butuh banyak iterasi
Complex coding cycles dengan debugging otomatis
Workflow automation yang sophisticated

💡 Contoh Real-World:

# Coding agent yang bisa iterate sendiri
agent = GeminiAgent(model="gemini-3.5-flash")
result = agent.execute_task(
    "Build a REST API with authentication, 
     database integration, and comprehensive tests"
)
# Model akan breakdown task, code, test, debug, iterate

Kelebihan:

Reasoning capability paling kuat
Excellent untuk multi-step workflows
Optimal untuk agentic era
Sustained frontier-level intelligence

Kekurangan:

Kemungkinan lebih mahal dari Flash Lite
Overkill untuk simple tasks

Gemini 3.1 Flash Lite — Best For:

⚡ High-Volume, Low-Latency Tasks

Translation massal (chat messages, reviews, support tickets)
Simple data extraction dari documents
Sentiment analysis dalam skala besar
Chatbot dengan response time kritis

💡 Contoh Real-World:

# Translation service dengan volume tinggi
texts = load_customer_messages()  # 10,000 messages
translations = []

for text in texts:
    response = client.generate_content(
        model="gemini-3.1-flash-lite",
        contents=text,
        system_instruction="Translate to English, output only translation"
    )
    translations.append(response.text)

# Fast, cheap, scalable

Kelebihan:

Paling murah dari ketiga model
Latency paling rendah
Perfect untuk high-frequency tasks
Cost-effective untuk volume besar

Kekurangan:

Reasoning capability terbatas
Tidak cocok untuk complex workflows
Accuracy mungkin lebih rendah untuk nuanced tasks

Gemini 3.1 Pro Preview — Best For:

🛠️ Software Engineering & Precision Tasks

Code review dan refactoring
Debugging kompleks
Precise tool usage dalam agentic workflows
Tasks yang butuh factual consistency tinggi

💡 Contoh Real-World:

# Code review agent dengan custom tools
tools = [
    Tool(name="view_file", ...),
    Tool(name="search_code", ...),
    Tool(name="run_tests", ...)
]

# Gunakan endpoint khusus untuk custom tools
response = client.generate_content(
    model="gemini-3.1-pro-preview-customtools",
    contents="Review this PR and suggest improvements",
    tools=tools
)
# Model akan prioritize custom tools kamu

Kelebihan:

Better thinking dan reasoning
Improved token efficiency
Factually consistent output
Optimal untuk software engineering
Custom tools endpoint tersedia

Kekurangan:

Masih dalam preview (belum stable)
File Search hanya di AI Studio
Mungkin lebih lambat dari Flash Lite

Pricing Considerations

Sayangnya Google belum publish pricing detail untuk ketiga model ini di dokumentasi yang saya akses. Tapi berdasarkan positioning:

Prediksi Pricing (dari termurah ke termahal):

Gemini 3.1 Flash Lite — Paling murah, optimized untuk cost
Gemini 3.5 Flash — Mid-range, balance antara capability dan cost
Gemini 3.1 Pro Preview — Paling mahal, premium capabilities

💡 Tips Hemat Biaya:

Gunakan Context Caching untuk context yang sering dipakai (bisa hemat hingga 90%)
Pakai Batch API untuk non-urgent tasks (biasanya lebih murah)
Pilih model sesuai kebutuhan — jangan pakai Pro untuk simple translation
Gunakan Flex Inference untuk workload yang tidak time-sensitive

Kapan Pakai Model Mana?

Bingung pilih yang mana? Ini decision tree sederhana:

Pilih Gemini 3.5 Flash jika:

✅ Kamu build agentic system atau AI agents
✅ Task butuh multi-step reasoning
✅ Coding workflows dengan iterasi kompleks
✅ Long-horizon tasks yang sophisticated
✅ Budget mid-range, prioritas capability

Pilih Gemini 3.1 Flash Lite jika:

✅ Volume sangat tinggi (ribuan/jutaan requests)
✅ Latency adalah prioritas utama
✅ Task sederhana dan straightforward
✅ Budget sangat ketat
✅ Translation, extraction, classification massal

Pilih Gemini 3.1 Pro Preview jika:

✅ Software engineering tasks
✅ Butuh factual accuracy tinggi
✅ Custom tools integration penting
✅ Precision lebih penting dari speed
✅ Okay dengan preview/beta status

Migration Guide

Kalau kamu sudah pakai Gemini 3.1 Flash Lite atau Pro Preview, haruskah upgrade ke 3.5 Flash?

Dari Flash Lite → 3.5 Flash

Upgrade jika:

Task kamu makin kompleks
Butuh better reasoning
Agentic workflows mulai penting
Budget bisa naik sedikit

Stay jika:

Volume masih sangat tinggi
Task tetap simple
Cost adalah constraint utama
Current performance sudah cukup

Dari Pro Preview → 3.5 Flash

Upgrade jika:

Butuh stable release (bukan preview)
Agentic workflows lebih penting dari precision
Ingin faster iteration cycles
File Search via API penting

Stay jika:

Software engineering focus
Custom tools heavily used
Factual consistency critical
Preview status bukan masalah

Code Examples: Praktis Pakai Ketiga Model

Mari kita lihat contoh praktis menggunakan ketiga model untuk task yang berbeda:

Example 1: Translation Service (Flash Lite)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

def translate_batch(messages, target_lang="en"):
    """Fast, cheap translation untuk customer support"""
    translations = []
    
    for msg in messages:
        response = client.models.generate_content(
            model="gemini-3.1-flash-lite",
            contents=msg,
            config={
                "system_instruction": f"Translate to {target_lang}. Output only the translation.",
                "temperature": 0.1  # Low temp untuk consistency
            }
        )
        translations.append(response.text)
    
    return translations

# Process 10,000 messages dengan cost minimal
messages = load_support_tickets()
translated = translate_batch(messages)

Example 2: Coding Agent (3.5 Flash)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

def build_feature_with_agent(feature_description):
    """Agentic workflow untuk build feature lengkap"""
    
    # Step 1: Planning
    plan = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Create implementation plan for: {feature_description}",
        config={
            "thinking": True,  # Enable reasoning
            "temperature": 0.7
        }
    )
    
    # Step 2: Implementation dengan iterasi
    code = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Implement this plan:\n{plan.text}\n\nWrite complete, tested code.",
        config={
            "code_execution": True,  # Execute code untuk testing
            "thinking": True
        }
    )
    
    # Step 3: Review dan refinement
    review = client.models.generate_content(
        model="gemini-3.5-flash",
        contents=f"Review this code and suggest improvements:\n{code.text}",
        config={"thinking": True}
    )
    
    return {
        "plan": plan.text,
        "code": code.text,
        "review": review.text
    }

# Build feature dengan multi-step reasoning
result = build_feature_with_agent("User authentication with JWT")

Example 3: Code Review (Pro Preview)

from google import genai

client = genai.Client(api_key="YOUR_API_KEY")

# Define custom tools untuk code review
tools = [
    {
        "name": "view_file",
        "description": "Read file contents",
        "parameters": {"path": "string"}
    },
    {
        "name": "search_code",
        "description": "Search codebase for patterns",
        "parameters": {"query": "string"}
    },
    {
        "name": "run_tests",
        "description": "Execute test suite",
        "parameters": {"test_path": "string"}
    }
]

def review_pull_request(pr_description, changed_files):
    """Precise code review dengan custom tools"""
    
    response = client.models.generate_content(
        model="gemini-3.1-pro-preview-customtools",  # Custom tools endpoint
        contents=f"""Review this PR:
        
Description: {pr_description}
Changed files: {changed_files}

Provide detailed review covering:
1. Code quality and best practices
2. Potential bugs or issues
3. Performance implications
4. Security concerns
5. Test coverage
""",
        config={
            "tools": tools,
            "thinking": True,
            "temperature": 0.2  # Low temp untuk precision
        }
    )
    
    return response.text

# Detailed, accurate code review
review = review_pull_request(
    pr_description="Add user authentication",
    changed_files=["auth.py", "models.py", "tests/test_auth.py"]
)

Tips Optimasi untuk Semua Model

Regardless model mana yang kamu pilih, ini best practices untuk maximize performance dan minimize cost:

1. Context Caching untuk Repeated Context

# Cache system instructions atau large context
cached_content = client.caches.create(
    model="gemini-3.5-flash",
    contents="Your large system instruction or context here...",
    ttl="3600s"  # Cache selama 1 jam
)

# Reuse cache untuk multiple requests
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="User query here",
    cached_content=cached_content.name
)
# Hemat hingga 90% cost untuk cached portion!

2. Batch API untuk Non-Urgent Tasks

# Submit batch job
batch = client.batches.create(
    model="gemini-3.1-flash-lite",
    requests=[
        {"contents": "Translate: Hello"},
        {"contents": "Translate: Goodbye"},
        # ... ribuan requests
    ]
)

# Check status nanti
status = client.batches.get(batch.name)
if status.state == "SUCCEEDED":
    results = status.results

3. Structured Outputs untuk Parsing

from pydantic import BaseModel

class CodeReview(BaseModel):
    issues: list[str]
    suggestions: list[str]
    severity: str

# Get structured output langsung
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Review this code: ...",
    config={
        "response_mime_type": "application/json",
        "response_schema": CodeReview
    }
)

review = CodeReview.parse_raw(response.text)
# No more manual parsing!

4. Temperature Tuning

# Low temperature (0.0-0.3) untuk:
# - Translation
# - Data extraction
# - Factual tasks
response = client.models.generate_content(
    model="gemini-3.1-flash-lite",
    contents="Extract email from: ...",
    config={"temperature": 0.1}
)

# Medium temperature (0.4-0.7) untuk:
# - Code generation
# - Creative tasks
# - Brainstorming
response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Generate API design for ...",
    config={"temperature": 0.6}
)

# High temperature (0.8-1.0) untuk:
# - Creative writing
# - Diverse outputs
# - Exploration

Kesimpulan: Mana yang Terbaik?

Tidak ada "model terbaik" — hanya model yang paling sesuai untuk use case kamu.

TL;DR:

Gemini 3.5 Flash = Swiss Army knife untuk agentic era, balance capability dan cost
Gemini 3.1 Flash Lite = Speed demon untuk high-volume simple tasks
Gemini 3.1 Pro Preview = Precision tool untuk software engineering

Rekomendasi saya:

Start dengan 3.5 Flash untuk most use cases — ini model paling versatile
Downgrade ke Flash Lite kalau ternyata task kamu simple dan volume tinggi
Upgrade ke Pro Preview kalau butuh precision tinggi untuk software engineering

Pro tip: Jangan takut mix-and-match! Pakai Flash Lite untuk preprocessing, 3.5 Flash untuk main logic, dan Pro Preview untuk critical review. Optimize per-task, bukan per-application.

What's Next?

Google terus develop Gemini series dengan cepat. Beberapa hal yang worth di-watch:

Pricing details yang lebih jelas untuk ketiga model
Benchmark results head-to-head comparison
Live API support untuk real-time applications
Computer Use capability (masih not supported)
Gemini 3.5 Pro (kemungkinan akan rilis soon?)

Untuk update terbaru, pantau terus Google AI Developer Docs.

Sudah coba Gemini 3.5 Flash? Share pengalaman kamu di comments! Atau kalau ada pertanyaan tentang migration dari model lama, feel free to ask. 🚀

Gemini 3.5 Flash Resmi Rilis: Perbandingan dengan 3.1 Flash Lite dan 3.1 Pro Preview

Kenalan dengan Tiga Model Gemini

Gemini 3.5 Flash — The Agentic Powerhouse

Gemini 3.1 Flash Lite — The Speed Demon

Gemini 3.1 Pro Preview — The Precision Expert

Perbandingan Spesifikasi Teknis

Perbandingan Capabilities

Fitur yang Didukung Semua Model ✅

Perbedaan Kunci 🔍

Perbandingan Performa dan Use Cases

Gemini 3.5 Flash — Best For:

Gemini 3.1 Flash Lite — Best For:

Gemini 3.1 Pro Preview — Best For:

Pricing Considerations

Kapan Pakai Model Mana?

Pilih Gemini 3.5 Flash jika:

Pilih Gemini 3.1 Flash Lite jika:

Pilih Gemini 3.1 Pro Preview jika:

Migration Guide

Dari Flash Lite → 3.5 Flash

Dari Pro Preview → 3.5 Flash

Code Examples: Praktis Pakai Ketiga Model

Example 1: Translation Service (Flash Lite)

Example 2: Coding Agent (3.5 Flash)

Example 3: Code Review (Pro Preview)

Tips Optimasi untuk Semua Model

1. Context Caching untuk Repeated Context

2. Batch API untuk Non-Urgent Tasks

3. Structured Outputs untuk Parsing

4. Temperature Tuning

Kesimpulan: Mana yang Terbaik?

What's Next?

Comments (0)

Gemini 3.5 Flash Resmi Rilis: Perbandingan dengan 3.1 Flash Lite dan 3.1 Pro Preview

Kenalan dengan Tiga Model Gemini

Gemini 3.5 Flash — The Agentic Powerhouse

Gemini 3.1 Flash Lite — The Speed Demon

Gemini 3.1 Pro Preview — The Precision Expert

Perbandingan Spesifikasi Teknis

Perbandingan Capabilities

Fitur yang Didukung Semua Model ✅

Perbedaan Kunci 🔍

Perbandingan Performa dan Use Cases

Gemini 3.5 Flash — Best For:

Gemini 3.1 Flash Lite — Best For:

Gemini 3.1 Pro Preview — Best For:

Pricing Considerations

Kapan Pakai Model Mana?

Pilih Gemini 3.5 Flash jika:

Pilih Gemini 3.1 Flash Lite jika:

Pilih Gemini 3.1 Pro Preview jika:

Migration Guide

Dari Flash Lite → 3.5 Flash

Dari Pro Preview → 3.5 Flash

Code Examples: Praktis Pakai Ketiga Model

Example 1: Translation Service (Flash Lite)

Example 2: Coding Agent (3.5 Flash)

Example 3: Code Review (Pro Preview)

Tips Optimasi untuk Semua Model

1. Context Caching untuk Repeated Context

2. Batch API untuk Non-Urgent Tasks

3. Structured Outputs untuk Parsing

4. Temperature Tuning

Kesimpulan: Mana yang Terbaik?

What's Next?

Comments (0)

Resources