Accesso immediato ai modelli in Microsoft Foundry (anteprima)

L'accesso immediato ai modelli consente di chiamare qualsiasi modello supportato in base al nome, senza che sia necessaria alcuna distribuzione. Creare un progetto Foundry, iniziare a scrivere codice e usare immediatamente qualsiasi modello disponibile.

Prerequisiti

  • Una sottoscrizione di Azure. Creane uno gratis.
  • Accedere a Microsoft Foundry. Assicurarsi che l'interruttore New Foundry sia attivato. Questi passaggi fanno riferimento a Foundry (nuovo).These steps refer to Foundry (new).
  • Progetto Foundry negli Stati Uniti occidentali 3 (l'unica area supportata per l'accesso immediato durante l'anteprima). Se è necessario creare un progetto, vedere Creare un progetto.
  • Il ruolo Foundry User nel progetto o nell'account.

Importante

I ruoli RBAC di Foundry sono stati recentemente rinominati. Foundry User, Foundry Owner, Foundry Account Owner e Foundry Project Manager erano precedentemente denominati Azure AI User, Azure AI Owner, Azure AI Account Owner e Azure AI Project Manager. È possibile che i nomi precedenti vengano visualizzati in alcune posizioni durante l'esecuzione della ridenominazione. Gli ID ruolo e le autorizzazioni di base sono invariati dalla ridenominazione.

Iniziare subito a usare i modelli

Con l'accesso immediato, il flusso di lavoro è semplice: usare un nome di modello istantaneo supportato nel codice. Nessuna distribuzione necessaria. La stessa API, l'SDK e il client già usati per le distribuzioni funzionano con modelli di accesso immediato. Nessun secondo SDK, nessun client separato, nessuna modifica alla configurazione.

Il supporto per l'accesso immediato continua a espandersi nel tempo. Esempi di nomi di modello che è possibile usare includono:

  • gpt-chat-latest
  • gpt-5.1-codex-max
  • gpt-5.2-codex
  • gpt-5.3-codex
  • gpt-5.5

Il set esatto cambia frequentemente. Vedere Modelli supportati per visualizzare l'elenco completo.

L'unica modifica rispetto al codice basato sulla distribuzione è il model parametro . Nel codice seguente sostituire "gpt-5-mini" (un modello distribuito) con il nome di qualsiasi modello di accesso istantaneo, ad esempio chat-gpt-latest.

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

Playground per i modelli ad accesso immediato

Per raggiungere il playground per i modelli di accesso immediato, usare uno di questi percorsi:

  1. In Home selezionare Playground.
  2. In Home selezionare Catalogo e quindi Playground.
  3. Nella pagina dei dettagli di un modello selezionare Playground.

Diagramma dei percorsi di navigazione da Home a Playground, inclusi i percorsi Catalog e Model.

Quando sei in un playground, usa il menu a discesa Model per passare ad altri modelli ad accesso immediato o distribuiti.

Perché l'accesso immediato è importante

  • Cambiare i modelli modificando una stringa : usare qualsiasi nome di modello istantaneo nella model= riga, senza creare o eliminare distribuzioni.
  • Stessa API e SDK : le stesse chiamate funzionano sia per l'accesso istantaneo che per le distribuzioni.
  • Funziona con i tuoi strumenti di sviluppo — l'accesso istantaneo si integra con Foundry CLI, VS Code e le pipeline CI/CD proprio come i deployment.

Le implementazioni non scompariranno. Rimangono la scelta giusta quando è necessaria una velocità effettiva riservata, filtri di contenuto personalizzati, residenza dei dati o configurazioni aziendali avanzate. L'accesso immediato semplifica l'esperienza iniziale, facendo sì che le distribuzioni diventino un passaggio successivo, non un ostacolo da superare prima di poter usare un modello.

Modelli supportati

I nuovi modelli supportano l'accesso immediato per impostazione predefinita quando vengono rilasciati. Il team del prodotto considera il supporto per modelli aggiuntivi in base alla domanda dei clienti. L'elenco cresce nel tempo ed esempi di modelli che potrebbero essere visualizzati includono:

  • chat-gpt-latest
  • gpt-5.1-codex
  • gpt-5.1-codex-mini
  • gpt-5.1-codex-max
  • gpt-5.2-codex
  • gpt-5.3-codex
  • gpt-5.5

Per visualizzare tutti i modelli che supportano l'accesso immediato:

  1. Aprire un progetto negli Stati Uniti occidentali 3 nella nuova esperienza Foundry,
  2. Selezionare Esplora nella barra di navigazione in alto a destra, quindi Modelli nel riquadro sinistro.
  3. Nel catalogo dei modelli selezionare Instant in Development options (Opzioni di sviluppo ) per visualizzare i modelli di accesso immediato disponibili.

È anche possibile elencare i modelli di accesso immediato a livello di codice:

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

Annotazioni

Durante l'anteprima, i modelli di accesso immediato sono disponibili solo nei progetti negli Stati Uniti occidentali 3 .

Alcuni modelli di accesso immediato potrebbero essere visualizzati nell'elenco anche se la sottoscrizione non ha alcuna quota. Per ulteriori informazioni, consulta Quote e limiti per Foundry Models.

Quando usare l'accesso immediato rispetto alle distribuzioni

Scenario Approccio consigliato
Introduzione, creazione di prototipi o sperimentazione Accesso immediato
Uso del modello più recente subito dopo il rilascio Accesso immediato
È necessaria capacità riservata o velocità effettiva prevedibile Distribuzione
Richiedi la larghezza di banda garantita (PTU) Distribuzione
È necessaria la residenza dei dati in un'area specifica Distribuzione
Criteri di filtro dei contenuti personalizzati per modello Distribuzione
Protezioni personalizzate per modello Distribuzione
Configurazione specifica dell'endpoint (ad esempio, vincoli di versione per endpoint) Distribuzione
Ripartizione dettagliata delle quote tra i team Distribuzione
Modelli ottimizzati Distribuzione

L'accesso istantaneo e le distribuzioni possono coesistere nello stesso progetto. È possibile iniziare con il modello di accesso immediato e creare una distribuzione in un secondo momento man mano che i requisiti si evolvono.

Versioni del modello

Per impostazione predefinita, l'accesso immediato usa la versione sempre aggiornata più recente di un modello. Per fissare una versione specifica, aggiungere la data della versione al nome del modello come suffisso separato da un trattino:

Quello che fai passare per model Behavior
model-name Indirizza alla versione più recente
model-name-2025-04-01 Percorsi per quella versione specifica

L'assicurazione della versione è facoltativa. Se l'applicazione richiede stabilità, includere il suffisso della versione. In caso contrario, si ottiene sempre la versione più recente automaticamente.

Modalità di utilizzo della quota

L'accesso immediato attinge a un pool di quota globale per modello assegnato alla tua sottoscrizione. Questa quota è separata dalla quota a livello di area usata dalle distribuzioni standard.

  • Non devi allocare né suddividere la quota globale: viene condivisa automaticamente tra tutti gli utilizzi del modello istantaneo nell’ambito della tua sottoscrizione.
  • Le implementazioni Global Standard riservano una parte della tua quota globale. I modelli di accesso immediato usano qualsiasi capacità rimanente.
  • Altri tipi di distribuzione (Regional Standard, Provisioned) utilizzano una quota regionale separata e non incidono sulla capacità del modello istantaneo.
  • Se le richieste di modelli istantanei vengono limitate, è possibile richiedere un aumento della quota o creare una distribuzione con capacità riservata.

Per altre informazioni su come interagiscono le quote globali e regionali, vedere Gestire e aumentare le quote.

Controlli per le aziende

Capability Come funziona
Bloccare modelli o provider specifici Le definizioni di Criteri di Azure si applicano all'accesso immediato così come si applicano alle distribuzioni
Aggiungi ai preferiti (versione modello) Aggiungere il suffisso della versione al nome del modello (vedere Versioni del modello)
Disabilitare completamente l'accesso istantaneo Gli amministratori possono disattivare l'accesso immediato a livello di sottoscrizione tramite Criteri di Azure

Per rimuovere l'accesso immediato da un account, configurare le impostazioni tramite Bicep o ARM REST.

Aggiornare l'account con:

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

Utilizza questo corpo della richiesta per disattivare in modo efficace l'accesso immediato ai modelli:

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

Importante

Tutti i modelli di accesso immediato usano protezioni predefinite e filtri di contenuto. Tuttavia, non è possibile configurare protezioni personalizzate o criteri di intelligenza artificiale responsabile (RAI) per ogni modello per l'accesso immediato. È possibile impostare un criterio RAI predefinito a livello di account tramite l'API, ma tale criterio si applica in modo uniforme a tutti i modelli di accesso immediato. Se sono necessari criteri di filtro del contenuto diversi per i singoli modelli, usare una distribuzione.

Collisioni tra nomi di distribuzione

Le nuove distribuzioni non possono usare un nome corrispondente a un nome di modello esistente. Se si dispone di una distribuzione esistente il cui nome si scontra con un nome di modello, la distribuzione ha la precedenza e l'accesso immediato al modello per tale nome non è disponibile in tale progetto.

Limitazioni durante l'anteprima

  • Disponibile solo negli Stati Uniti occidentali 3 .
  • I modelli ottimizzati non sono supportati. Per utilizzare un modello ottimizzato, crea una distribuzione.
  • Le protezioni, i criteri RAI personalizzati e i filtri di contenuto non sono configurabili per l'accesso immediato.
  • Solo i modelli elencati in Modelli supportati sono idonei.